数据标注公司离不开这三种市场结构
随着人工智能对数据标注需求的演变以及标注行业的发展,标注市场上不仅仅有工厂结构(即全职数据标注员完成标注任务),而是衍生出了新的发展结构,如今的数据标注市场可以分为
数据标注众包结构指需求公司通过众包平台发布标注需求,随后数量众多的标注志愿者或兼职人员在平台上自由领取标注任务。
众包结构能够充分利用分散的智力和劳动资源。它模糊了专业和业余的界限,让人们能够在空闲的时间去做自己喜欢且擅长的事情。既能够产生应有价值,且帮助企业解决眼前标注时间紧、任务多的问题。
为什么很多数据标注公司会使用众包结构?是因为这种结构最大限度地节省了公司在标注成本上的损耗——人力成本,成本降低,利润空间自然就会变大。当然,这种结构同样存在弊端。
不同能力的数据标注员共同完成一个大型标注项目,任务完成质量很难达到统一,甚至导致训练的模型在实际中根本没法应用。同时,在标注过程中需要多次有效沟通,将所有数据标注员沟通时间统一,是一件很困难的事情,沟通成本、管理成本极高。
由于众包平台上人员混杂,接触数据的人员众多,极不利于数据的安全保密。众包结构下的数据标注过程可能会造成数据泄露的风险。
当需求方需要对标注需求进行调整时,众包的志愿者及兼职人员也无法及时地配合完成任务的修改和调整。
工厂结构,能够解决绝大多数众包结构带来的问题。有着稳定的标注人员,沟通成本低,能够保障需求方的数据安全,为需求方提供更灵活的服务。但这种结构同样存在一些问题。
很多小型数据标注公司为了生存接收短期的小型项目,常面临没有任务可做的情况,员工的薪资要照常发放,成本损耗很高。
很多数据标注公司宁可暂时没有项目,也坚持等待长期的大型项目,因为短期的小型项目在初期的培训测试等方面成本极高,项目额度过小甚至无法覆盖成本。
现阶段工厂结构两极化现象十分严重,大规模的数据标注团队的人数可能超过数千人,而小规模团队的人数甚至不超过十个。目前,市场上大规模的专业数据标注公司不在少数。
成熟的数据标注公司已经学会将众包结构和工厂结构相结合,扬长避短。这种混合结构下,数据标注公司即拥有全职及兼职标注团队,也拥有众包平台。
但并不意味这种混合结构适合所有的标注公司。无论是采用哪种结构,都会有自己的优势和劣势。混合结构能否成为数据标注行业在未来的主流形式,还需要市场的检验。
淘丁集团是一家多元化发展的高新技术服务型企业,公司在国家新一代人工智能发展规划的引领下,基于大数据、人工智能、区块链等高新技术,致力于智慧城市、智慧税务、企业服务、数据标注&内容审核的四大生态集群建设,客户提供云到端的互动应用及移动信息化服务,打造信息化融合服务平台,全方位满足政府与企业的信息化需求。
淘丁数据标注&内容审核业务是公司在构建基础数据产业基地,协助政府构建区域数据流通、交易中心,形成区域特色AI产业人才供给中心的一项重要业务。淘丁总部位于陕西西安,子公司遍布宝鸡、太原、宝鸡、济南、海南等众多城市,员工1100多人,业务娴熟,具备短期内处理海量应急数据、复杂大数据项目、横跨多个标注项目同时作业的能力,可以满足不同政府部门、国企单位、大型私企、高校院校等大数据处理项目的要求。返回搜狐,查看更多
- 标签:本站
- 编辑:白守业
- 相关文章
-
数据标注公司离不开这三种市场结构
随着人工智能对数据标注需求的演变以及标注行业的发展,标注市场上不仅仅有工厂结构(即全职数据标注员完成标注任务),而是衍生出了…
- 西安迎来首个高风险区降级!全市共有25个中高风险地区
- 一码通_数字化_西安_数据
- 2023年度都市快报订阅订报电话多少(正在实时更新中)
- 12月8日陕西疫情最新消息西安疫情防控有变
- 关注丨安康日报头版头条报道汉阴庭院经济工作
- 头条 - 安康新闻网
- 安康今天发生的事128
- 西安经开十四小:云端守护抗疫情线上教学显风采
- 12月9日以来陕西西安累计报告本土确诊病例255例
- 西安公布解除封控管理政策及安排