目前国内数据标签市场规模有多大?
头部企业是自建数据团队,中小型数据供应商占很大比例。
目前中国国内数据标注市场第一梯队包括头部公司成立自己的数据标注部门,JD.COM(JD.COM中智)、百度(百度中策)、腾讯、阿里(阿里数据标注)都有自己的标注平台和工具。除了头部公司,近年来国内也涌现出很多数据标签公司,如龙猫数据、Testin云测、Besay BasicFinder、Data Hall等。这些公司仅次于头部公司,都具有相当的规模,位于第二梯队。
在中国数据标签行业的参与者中,按规模划分,品牌数据服务商、中小型数据供应商和需求方自建基础数据团队形成市场竞争关系,是AI数据标签市场的主要供应商,2019年占比分别为30.4%、47.0%和22.6%。目前,中小型数据供应商是市场上的主要供应商。
按照模式分为数据标签公司和众包平台,服务范围广泛。
按照参与方式,中国数据标签行业的参与企业主要分为众包平台和自建工厂(专业数据标签公司)。2020年数据标签公司排名中,Testin云测、数据堂、龙猫数据位在前三;在数据标签众包平台排名中,JD.COM众智、百度中策、数据堂位列前三。
从数据标注代表企业的业务布局来看,大部分数据标注服务商提供文本、语音、图像、视频等多种类型的数据标注,其服务应用领域涵盖安防、智能驾驶、医疗、教育、金融等多个领域,主要客户包括科技公司、人工智能企业、传统企业、政府部门、科研机构等。
以视觉业务为主的企业大多自建贴标基地,多分布在山西、河南等地。
AI数据表明,根据业务方向和进入市场的时间,行业内的玩家大致可以分为早期玩家、中后期玩家、专注于视觉服务的玩家和专注于语音服务的玩家。其中,更专注于语音数据的玩家,通常拥有更多自己知识产权的数据集;有自建贴标基地或专职贴标团队的,多为视觉玩家。
作为人工智能产业链中不可或缺的一环,AI数据标注服务的发展已经成为各地推进AI建设的重要方向之一。贵州、山西、重庆等地相继出台指导意见,引进科技公司,建设数据基地和数据交易中心,打造具有地方特色的人工智能产业园。
目前很多数据标注公司自建标注基地或团队,如百度在山西的AI数据标注基地、百度大数据百鸟河基地、数据厅的保定数据处理基地、数据厅的合肥数据基地、数据厅的北京TTS录音中心等,大多分布在山西、河南等地。
北京、上海、成都是需求企业前三名,杭州数量有所下降。
从需求企业来看,根据AI数据标注统计,2020年4月,国内数据标注企业数量为565家,2020年2月,数量增至705家。从数据标注企业的区域分布来看,截至2020年底,65438+2月,北京、上海、成都、深圳、杭州为TOP5城市,企业数量分别达到185、84、68、63、46家。其中,北京、上海、成都、深圳企业数量较2020年4月均有所增加,杭州企业数量较2020年4月有所减少。
市场集中度低,未来会有所改善,行业并购会成为趋势。
2019年AI数据标签行业CR5(前五大企业市场份额)为26.2%,处于低集中度竞争阶段,行业充满活力,发展空间良好。五大企业中,海天日盛和百度数据众包越来越受欢迎。据了解,在国内整体供应商中,大部分公司提供图像数据采样服务,涉及人像数据、OCR数据、自动驾驶数据等。业务需求分散,其中百度数据众包收入分成占比最大。
相比较而言,语音数据的需求相对集中,供给门槛高于图像数据。内容包括语音识别数据、语音合成数据等。,其中海天盛瑞的收入份额最大。
目前人工智能数据标签行业集中度适中,既不是寡头垄断市场,也不是充分竞争市场。一方面,百度数据众包、海天盛瑞、数据堂等企业进入市场较早,积累了较多的客户资源。另一方面,由于下游企业之前使用的是公共数据集训练模型,对数据高精度的要求仍然是短暂的,由于生态传导效应的滞后性,市场门槛并不明显。资本和R&D实力较弱的中小企业仍有较强的发展土壤。
但未来随着下游企业的发展,直接使用外包团队成本低,数据安全性和可控性强。一些基本需求将由下游企业自给自足,外部数据服务提供商的现有存量市场将面临下滑,因此必须承担高难度、前沿的独特任务,这就要求他们投入高精度、专业的数据处理工具的研发和人工智能算法的基础研究,以把握客户需求,开拓增量市场。因此,资本和R&D实力已经成为一个较高的行业门槛。同时,由于近年来资本市场的降温,一批中小厂商面临业务收缩。此外,一些制造商已经开始在行业内进行并购。参考海外数据服务市场的发展(海外行业巨头阿彭多次收购其他公司),并购也将成为市场趋势,在多重因素的影响下,行业集中度将会提高。
综上所述,数据标签行业的兼并重组将成为未来的大势所趋。目前国内一个典型的M&A事件就是Bisai BasicFinder收购了一批专业的人工标注服务提供商,以此来丰富独立的数据采集系统,完成更加多样化的任务。全球数据标签行业的兼并重组步伐加快。
一方面,头部企业逐渐收购中小微数据平台,将议价能力提升到一个新的高度。在此背景下,全球数据标签行业的市场集中度进一步提高。数据标签行业的并购规模将持续增长,行业竞争将日趋激烈。
——更多数据请参考前瞻产业研究院《中国数据标签行业市场前瞻与投资战略规划分析报告》。