那些好的大数据平台,数据平台介绍( 四 )


想查询行业数据 , 国内有哪些专业的数据平台推荐?

那些好的大数据平台,数据平台介绍


艾媒数据中心(data.iimedia.cn)是全球知名的新经济行业数据挖掘和分析机构iiMedia Research 艾媒咨询旗下行业研究数据库 。基于自主研发6大数据处理系统 , 以及强大的大数据监测、处理和分析能力 , 艾媒数据中心有行业数据库、投融数据库、基础数据库、人群洞察数据几大板块 , 划分了524个垂直行业 , 包含5000多个数据主题、超2亿条数据 , 研究领域包含交运物流、金融行业、房地产、电子商务、媒体与广告、零售和贸易、能源和环境服务、农林牧渔、化工和原料、健康与制药、电信行业、IT行业及战略性新兴产业等 。
请问大神现在数据标注有前景吗?能不能详细介绍一下有几个平台?
数据标注为通过分类、画框、标注、注释等 , 对图片、语音、文本等数据进行处理 , 标记对象的特征 , 以作为机器学习基础素材的过程 。中国数据标注行业参与企业类型按参与模式主要分为众包和自建工厂两种模式 , 其中 , 众包模式主要包括百度众包、京东众智、龙猫数据等;工厂模式主要包括贝赛、云测、爱数智慧、海天瑞声、阿里数据标注、元坤智能数据、点我科技等 。
头部企业为自建数据团队 , 中小数据供应商占比较大目前 , 我国国内数据标注市场第一梯队包括头部公司组建自己的数据标注部门 , 京东(京东众智)、百度(百度众测)、腾讯、阿里(阿里数据标注)都已经拥有自己的标注平台和工具 。头部公司之外 , 国内近年兴起众多数据标注公司 , 如龙猫数据、Testin云测、倍赛BasicFinder、数据堂等 。
这些公司仅次于头部公司 , 都具有相当的规模 , 位于第二梯队 。在中国数据标注行业参与主体中 , 按规模划分 , 品牌数据服务商、中小数据供应商和需求方自建基础数据团队构成市场竞争关系 , 为AI数据标注市场的主要供应方 , 在2019年AI数据标注市场份额占比分别为30.4%、47.0%和22.6% , 目前中小数据供应商是市场中的主要供应力量 。
按模式分为数据标注公司和众包平台 , 服务领域广泛中国数据标注行业参与企业类型按参与模式主要分为众包平台和自建工厂(专业数据标注公司)两种模式 。2020年数据标注公司排行榜中 , Testin云测、数据堂、龙猫数据位居前三;数据标注众包平台排行榜中 , 京东众智、百度众测、数据堂位居前三 。从数据标注代表企业业务布局来看 , 大部分数据标注服务商提供文本、语音、图像、视频等各类型数据标注 , 服务应用领域涵盖安防、智能驾驶、医疗、教育、金融等多个领域 , 主要客户包括科技公司、人工智能企业、传统企业、政府部门、科研机构等 。
业务偏重视觉类的企业多拥有自建标注基地 , 多分布在山西、河南等地AI数据标注业内玩家按照业务方向和进入市场的时机可做粗略划分 , 包括早期进入玩家、中晚期进入玩家、偏重视觉类业务玩家、偏重语音类业务玩家等 。其中 , 业务更偏重语音类数据的玩家 , 通常拥有较多的自有知识产权数据集;拥有自建标注基地或全职标注团队的则多为偏重视觉类的玩家 。
作为人工智能产业链中必不可少的一环 , 发展AI数据标注服务成为了各地方推进AI建设的重要方向之一 , 贵州、山西、重庆等地相继出台指导意见 , 引入科技公司 , 共建数据基地、数据交易中心 , 打造具有地方特色的人工智能产业园 。目前 , 众多数据标注公司自建标注基地或团队 , 如百度的“百度山西的AI数据标注基地”、“百度大数据百鸟河基地” , 数据堂的“数据堂保定数据加工基地”、“数据堂合肥数据基地”、“数据堂北京TTS录音中心”等 , 多分布在山西、河南等地 。

推荐阅读