数据标注

适用于大规模的图像、视频、语音、文本以及其他特殊数据的数据清洗、评估、提取以及特殊信息标注,专业的标注团队高效、稳定提供数据标注服务。

产品概述 使用场景 产品优势 合作案例 相关推荐 定制服务

产品概述

为客户提供专业的AI数据标注服务,凭借百度智能云10年的数据服务经验和标注基地丰富的标注人力,可准确、高效、安全地完成各类型数据标注任务,助力客户算法模型训练。

使用场景
  • 计算机视觉
  • 语言识别
  • 自然语义
  • 图像语义分割

  • 图片分类

  • 图片框选

  • 人脸骨骼打点

  • 3D点云

  • 2D3D融合标注

  • 连续帧标注

  • 视频分类

  • 视频内容提取

图像语义分割

图像语义分割是基于区域的多边形标注,对复杂不规则的图片进行区域划分并标注对应属性,助力图像识别模型训练,多应用于人体分割、场景分割和自动驾驶道路分割,可应用于智能驾驶、智能设备、智能安防场景落地。

10W 区域/天

采集能力

98% +

正确率

图片分类

基于百度标注基地人力可实现千万量级的图片清洗分类,依据您的需求可对您提供的图片集做属性归类,助力图像识别模型训练,可应用于智慧零售、智能设备、智能文娱等场景。

300W 图/天

采集能力

99% +

正确率

图片框选

图片框选可助力图像识别模型训练,用于框选图片中的识别主体目标,常见于对人脸、人体、障碍物、红绿灯的框选,可应用于智能驾驶、智能安防、智能设备的场景落地

10W 框/天

采集能力

99% +

正确率

人脸骨骼打点

人脸骨骼打点是基于点的标注,多应用于标注图片中人脸五官、人体骨骼关键点和汽车轮胎接地点,助力于图像识别模型训练,可应用于智能驾驶、智能设备、智能安防场景落地。

15W 图/天

采集能力

98% +

正确率

3D点云

3D点云标注可助力自动驾驶模型的训练,百度基于自身丰富的自动驾驶标注经验和先进的标注工具,可对3D障碍物进行框选、对雷达图进行语义分割,帮助车辆更好的感知路面,可应用于自动驾驶场景的训练落地

40W 框/天

框选能力

800 帧/天

分割能力

2D3D融合标注

2D3D融合标注可助力自动驾驶模型的训练,百度基于自身丰富的自动驾驶标注经验和先进的标注工具,可对2D3D多传感器融合的数据进行同时标注,帮助车辆实现视觉和雷达的感知,可应用于自动驾驶场景的训练落地

10W 框/天

采集能力

98% +

正确率

连续帧标注

连续帧标注常用于自动驾驶及视频图像识别模型的训练,通过对视频进行抽帧,并对每一帧图片中的目标物体进行连续标注,可应用于智能驾驶、智能安防、智能设备的场景落地

25W 框/天

采集能力

98% +

正确率

视频分类

视频分类是通过观看视频片段对视频按主题进行分类,助力建立视频资料库,常用于视频行业的图像识别模型训练,可应用于智慧文娱场景的落地

1W 段/天

采集能力

98% +

正确率

视频内容提取

视频内容提取是对视频进行抽帧,并对每一帧画面里的字幕进行转写,对视频主题进行归纳提取,助力建立视频资料库,常用于视频行业的图像识别模型训练,可应用于智慧文娱场景的落地

5W 条/天

采集能力

98% +

正确率

  • 语音清洗

  • 语音转写

  • 语音切分

  • 音素标注

语音清洗

语音清洗通过技术清洗空音频,并由人工进行监听,筛选出符合要求的音频,基于百度标注基地人力可实现海量音频清洗,助力语音识别模型训练,可应用于智能家居、智能设备、智能客服、智慧门店等场景落地

300 小时/天

采集能力

98% +

正确率

语音转写

语音转写是根据音频播放的内容转写为对应的文本,常用于语音识别模型训练,可支持普通话、方言、英文和小语种的语音转写,应用于智能家居、智能设备、智能客服、智慧门店等场景落地

50 小时/天

采集能力

98% +

正确率

语音切分

语音切分是对长音频进行监听,标注音频中说话人的起始点,用于语音识别模型训练,应用于智能家居、智能设备、智能客服、智慧门店等场景落地

200 小时/天

采集能力

98% +

正确率

音素标注

音素标注是对音频进行监听,转写文本同时对文字的音标进行标注,常用于语音合成技术

5000 句/天

采集能力

98% +

正确率

  • 文本清洗

  • 文本分类

  • 文本富集

  • OCR转写

  • 情感标注

  • NLP标注

文本清洗

文本清洗是按照您的的规则对文本进行筛选,挑出符合要求的数据,基于百度标注基地人力可实现千万级文本的清洗,助力NLP模型训练,可应用于智能客服、智慧金融、智能驾驶等场景。

100W 条/天

采集能力

98% +

正确率

文本分类

文本分类是按照您的的规则对文本进行属性分类,基于百度标注基地人力可实现百万级文本的分类操作,助力NLP模型训练,可应用于智能客服、智慧金融、智能驾驶等场景。

20W 条/天

采集能力

98% +

正确率

文本富集

文本富集是围绕主题进行文本撰写,使得对于同一主题,文本表达方式多样且贴合实际,助力NLP模型训练,可应用于智能客服、智慧金融、智能驾驶等场景。

2W 条/天

采集能力

98% +

正确率

OCR转写

OCR转写是对图片中的文字内容进行标框和转写,支持中文、英文及小语种的图片转写,助力图片和文本识别模型,可应用于智慧文娱、智能设备等场景

20W 条/天

采集能力

98% +

正确率

情感标注

情感标注是对文本表达情绪倾向进行判断,分类积极和消极的文本,可助力NLP模型训练,可应用于智能家居、智慧文娱、智慧金融等场景

10W 条/天

采集能力

98% +

正确率

NLP标注

NLP标注是对文本语法的标注,包括槽位提取、文本关系等,可助力NLP模型训练,可应用于智能家居、智慧文娱、智慧金融等场景

5W 条/天

采集能力

96% +

正确率

产品优势

经验丰富

10年行业和百度内部项目经验,可
高效完成各类标注任务

技术领先

业内最强的标注算法能力,充分提升
质量和产能

资源充足

业内最大的数据标注基地,具备充足
标注人力

标准严格

建立业内最严苛的安全/审核/作业流
程,保障安全与质量

合作案例

花卉图片分类标注

项目需求

经过自动化初步分类的3,300,000张花卉照片进行进一步人工分类。

标注成果

22天完成3,380,796张图片分类标注工作,准确率达96%。

人脸照片打点标注

项目需求

300万张人脸照片分类、检测及定位标注,部分图需标出600余个定位点。

标注成果

27天完成300万的人脸照片打点标注,准确率99%以上,成本为外包公司的1/4。

道路图片交通元素框选

项目需求

500,000+张道路图片进行内容实体标注。标注的实体为多种类型的交通元素,包括:小汽车、客车、大货车、面包车、行人、自行车、三轮车、摩托车、手推车等地面元素,并对图片中有遮挡或截断的元素进行属性标记。另需单独针对图片中的红绿灯进行标注且区分红绿灯属性(形状、颜色、方向等)。

标注成果

分批次交付,准确率99%,合作方肯定交付速度与质量。

自动驾驶数据集标注

项目需求

3D点云数据标注,部分单帧图片中含有多达162辆交通工具或80名行人;同时需将路段对应的室外稠密点云数据按照19个分类进行精确分割标注。

标注成果

在20天内交付了正确率高于98%的22344帧图像语义标注与1.5km点云分割结果,工作效率是需求方自有标注人员的2倍,并陆续以高度的弹性与专业的快速反应能力应对了七次标注规则变更。

语音数据转写与清洗

项目需求

对10,000条语音数据进行文本转义,并对语音录制质量进行分类清洗(清晰、有噪声、语音不完整等)

标注成果

22天完成3,380,796张图片分类标注工作,准确率达96%。3天内标注10,000条语音数据,通过率100%

相关推荐

数据采集

安全高效的解决模型算法的数据服务

一体化智能驾驶数据解决方案

提供一整套的智能驾驶数据服务,打造数据驱动闭环

定制服务

专业AI数据助力企业智能领域发展

申请服务