数据与算法、算力并称为人工智能发展的“三要素”,其中经过规范标注形成的高质量数据集,已成为人工智能赋能千行百业的核心支撑。近日,省数据局印发《关于推进人工智能行业高质量数据集重点项目建设的通知》,台州市共有7个项目成功入选。
跟着小布一起来看
我市7个入选项目
01
电机核心部件全流程质量管控数据集
建设单位:信质集团股份有限公司
项目介绍:聚焦电机零部件生产质量管控与效率提升痛点,归集生产过程中工艺参数、设备运行、质量检测等数据约83.5TB,构建电机核心部件全流程质量管控数据集,支撑单件产品生产周期平均缩短12秒,质量不良率平均下降70%以上,累计实现成本节约超300万元。
02
研发设计多模态AI数据集
建设单位:杰克科技股份有限公司
项目介绍:聚焦自动化产品设计与参数优化、文档解析与知识复用、仿真校验与故障预警等场景,整合多模态数据样本超120万条,数据量总计3.8TB,构建缝纫机研发设计多模态高质量数据集,数据完整性达到≥99.5%,标注准确率≥98.5%,推动研发模式转型,提升效率并降低成本。
03
模塑产业全生命周期多模态高质量数据集
建设单位:浙东南人工智能研究院(台州)有限公司
项目介绍:聚焦模具行业研发设计、中试验证、生产制造等关键环节,整合模具3D模型、工艺参数、CAE仿真结果等PB级多模态数据,构建模塑产业全生命周期多模态高质量数据集,支撑研发周期平均缩短30%、注塑废品率降低40%,赋能制造业高质量发展。
04
电机行业高质量数据集
建设单位:台州市路桥数字产业有限公司
项目介绍:聚焦电机行业订单处理与安装售后环节人工效率低、错误率高、数据利用不足等痛点,整合订单图片11091张、安装图片10422张,构建电机行业高质量数据集,实现订单处理时效提升2倍、安装合规判断准确率达95%。数据集已上架台州电机行业可信数据空间,大幅降低中小企业AI应用门槛。
05
脑栋大开—多模态对话数据集
建设单位:台州市脑栋大开网络科技有限公司
项目介绍:聚焦AI语音产业ASR模型训练中数据集稀缺、标注规范不一及方言缺口等痛点,累计建成1400小时符合阿里、腾讯训练标准的多模态多轮对话高质量数据集,标注准确率达95%以上,通用ASR字错误率从8.2%降至5.1%,推动国产语音技术跨越升级,并形成可复制推广的数据集建设运营与版本管理体系。
06
高精度齿轮检测数据集
建设单位:浙江双环传动机械股份有限公司
项目介绍:聚焦精密零部件制造行业质量管控核心痛点,整合齿轮生产全生命周期数据,汇聚原料、加工传感参数、外观尺寸及金相等实验室检测数据,构建总量约3TB的高精度齿轮检测高质量数据集,赋能智能检测模型研发、设备迭代与行业精细化质量管控,支撑工业检测效率提升超30%。
07
具身智能机器人多模态操作数据集
建设单位:浙江台州湾园区运营管理有限公司
项目介绍:面向工业制造、商业零售、家庭服务等场景,采集图像、3D点云及机器人多传感器时序数据,预计形成图像超1TB、视频超8000小时、3D点云超50TB、操作轨迹超10亿条的高质量数据集,支撑VLA模型与机器人智能体训练,提升工业装配成功率20%以上,降低训练成本约30%,推动具身机器人规模化落地。
下一步,台州将持续深化高质量数据集建设、应用,加速释放数据要素价值,为我市争创人工智能创新应用先导区贡献数据力量。
编辑:王潇莹
一审:张婷
二审:泮永翔
三审:黄元杰
来源:台州市数据局
热门跟贴