数据采集

适用于各种复杂场景数据采集的需求,海量众包用户定制化线下采集,涵盖图片、文本、语音、视频等全维度多媒体数据。

产品概述 使用场景 产品优势 合作案例 相关推荐 定制服务

产品概述

为客户提供专业的AI数据采集服务,凭借百度智能云10年数据服务经验和丰富的采集资源,可提供包括人像、语音、自动驾驶等在内的多种数据采集服务,
安全高效地解决模型算法的数据来源问题。

使用场景
  • 计算机视觉
  • 语言识别
  • 自然语义
  • 图像抓取

  • 图像采集

  • 人像采集

  • 视频采集

  • 自动驾驶道路采集

图像抓取

图像抓取服务可快速抓取网络公开的各类图像,并通过技术和人工清洗,筛选出符合您模型要求的数据,助力图像识别模型训练,可应用于智能设备、智慧金融、智慧零售等场景。

1000W 图/天

采集能力

97% +

正确率

图像采集

图像采集服务,基于百度线下采集用户,可拍摄包括商品、汽车、文档、风景等各类真实生活中的图像,助力图像识别模型的训练,可应用于智慧零售、智能设备等场景。

10W 图/天

采集能力

97% +

正确率

人像采集

人像采集服务可助力提升人脸识别模型的准确率,基于百度线下采集能力,可在全国及海外22个国家开展多人种的人脸图像采集,支持多角度、多光线、多场景的多样化采集要求。可在智能设备、智能安防、智慧金融等视觉场景落地。

500 人/天

采集能力

97% +

正确率

视频采集

视频采集服务,可拍摄指定的物体、人脸、安防等场景的视频,支持多角度、多光线、多场景的多样化采集要求。可在智能安防、智能设备、智慧金融等视觉场景落地。

5000 段/天

采集能力

97% +

正确率

自动驾驶道路采集

百度自有采集车队,搭载激光雷达和工业相机,可提供跨城市的2D、3D道路数据采集服务,支持车辆定制化和传感器改装,适用于自动驾驶模型的训练,可应用于基于视觉或雷达方案的自动驾驶场景训练落地。

500 公里/天

采集能力

99% +

正确率

  • 唤醒词采集

  • ASR语音采集

  • TTS语音采集

唤醒词采集

唤醒词采集,基于百度采集资源录制用户的唤醒词语音,人群可覆盖全国各地,支持特定设备、远近场、多语速的语音录制,助力语音识别模型训练,可应用于智能家居、智能设备、智慧门店等场景落地

1000 人/天

采集能力

97% +

正确率

ASR语音采集

ASR语音采集可助力语音识别模型的训练,通过百度全国各地和海外资源,可采集包括普通话、方言、英文和小语种等各类语音音频,可应用于智能家居、智能设备、智能客服、智慧门店等场景落地

100 小时/天

采集能力

97% +

正确率

TTS语音采集

TTS语音采集常应用于语音合成技术,百度可提供专业发音人在专业录音棚环境下录制高保真语音,可应用于智能客服、智能家居、智能设备等场景落地

10 小时/天

采集能力

98% +

正确率

  • 网页抓取

网页抓取

网页抓取可快速抓取您提供的网页中的文本内容,通过技术抓取和人工清洗,筛选出符合您模型要求的数文本,助力NLP模型训练,可应用于智能客服、智慧金融、智能驾驶等场景。

5000W 条/天

采集能力

97% +

正确率

产品优势

经验丰富

10年行业和百度内部项目经验,可
高效完成各类标注任务

技术领先

业内最强的标注算法能力,充分提升
质量和产能

资源充足

业内最大的数据标注基地,具备充足
标注人力

标准严格

建立业内最严苛的安全/审核/作业流
程,保障安全与质量

合作案例

多表情人脸照片采集

项目需求

10万张人脸照片采集,每个人的人脸照片包含至少20种不同夸张表情、各种不同角度和动作。

标注成果

9天内采集129,248张人脸照片,照片涉及6,000余人,每人20个不同表情及动作。成本比一般市场价格低30%,节约用时约1-2天。

唤醒词采集

项目需求

采集不同年龄段人群(着重区分儿童、老人)语音,目标采集300人的机器录制和3万人手机录制唤醒词语音。希望环境最大程度还原家居环境。

标注成果

2周内,采集语料覆盖全年龄段,共计采集382人机器录制语音,32,665人手机录制语音。成本比一般市场价格低30%,节约用时约3-5天。

粤语方言语料采集

项目需求

录制2,000人累计时长1,000小时粤语方言语料。录制者需包含:女性、男性、儿童、成人、老人等。

标注成果

20天完成1,100小时粤语语音采集。成本比一般市场价格低30%,节约用时约10天。

相关推荐

数据标注

安全高效的解决模型算法的数据服务

一体化智能驾驶数据解决方案

提供一整套的智能驾驶数据服务,打造数据驱动闭环

定制服务

专业AI数据助力企业智能领域发展

申请服务