
深圳市政务服务和数据管理局关于发布《2025年深圳市人工智能语料券专项资金申请指南》的通知
各有关单位:
为贯彻落实《深圳市打造人工智能先锋城市的若干措施》(深工信规〔2024〕13号),根据《深圳市人工智能语料券专项资金操作规程》(深政数规〔2025〕1号),我局组织开展2025年人工智能语料券专项资金申报。具体申报要求请参见申请指南。
申报截止日为2025年9月30日,建议申报企业提前至少3个工作日提交,避免预审退回后因时间不足无法重新提交而导致申报失败。
特此通知。
资助的项目类别
(一)语料采购资助
对企业通过数据交易所购买非关联方(是指买卖双方不是母子公司、直接或者间接地同为第三者控制等关联关系)语料进行人工智能大模型研发和应用的活动,予以一定比例的资助。
(二)语料数据开放奖励
对企业通过深圳市公共数据开放平台开放符合要求的语料的活动,予以一定额度的奖励。
资助方式和标准
(一)语料采购资助
1.对于当年度符合条件的申报企业,每年按不超过语料采购总费用30%,最高200万元予以资助。语料采购总费用以直接用于语料数据采购的费用为准。具体资助金额根据语料采购总费用、数据量、应用成效等维度综合打分评定。
2.应用成效可以参考数字深圳联合创新中心(人工智能实验室)等平台或市场成效验证等结果。
3.采购语料应用的项目获得省级以上人工智能类、科学技术进步类奖项,或者获得省级以上人工智能、科学技术相关创新平台资格认定的可适当予以加分。
4.申报企业获得创新型中小企业、专精特新中小企业、专精特新“小巨人”中任意一个认定的,可适当予以加分。
(二)语料数据开放奖励
1.申报企业在申报期限内累计开放语料数据规模达到以下标准之一(满足各类型中的任意一项数量即可,其他类型数据可以参照以下类型并根据实际情况评定),给予不超过40万元的奖励:
通用类,预训练文本类数据不低于10万条、标注文本类数据不低于1万条、指令集/图片类数据不低于1万组/张、音频/视频类数据不低于100小时、结构化数据不低于10万条;具身智能类,多模态数据不少于1万条(至少包含文本、RGB、深度三个模态)、动作与运动控制数据不少于1万条、人类行为数据不少于1万条、仿真场景不少于2000个、数字资产模型不少于1万个。
2.申报企业在申报期限内累计开放语料数据规模达到以下标准之一(满足各类型中的任意一项数量即可,其他类型数据可以参照以下类型并根据实际情况评定),给予不低于40万元,最高100万元的奖励:
通用类,预训练文本类数据不低于6000万条、标注文本类数据不低于60万条、指令集/图片类数据不低于60万组/张、音频/视频类数据不低于2000小时、结构化数据不低于1000万条;具身智能类,多模态数据不少于5万条(至少包含文本、RGB、深度三个模态)、动作与运动控制数据不少于5万条、人类行为数据不少于5万条、仿真场景不少于1万个、数字资产模型不少于10万个。
3.奖励金额根据企业年度开放语料的数据量、质量、更新频率、应用成效等维度综合评定。
4.应用成效可以参考数字深圳联合创新中心(人工智能实验室)等平台或市场成效验证结果。
(三)资助累计标准
本语料券发放措施与我市市级层面其他同类优惠措施不重复享受。对于已获得国家或省级财政支持的项目,我市各级财政对同一项目累计资助金额不得超过该项目经审计认定的投资额。
附件
1.2025年深圳市人工智能语料券专项资金申请指南
2.2025年深圳市人工智能语料券资助项目申请书(参考模板)
3.2025年深圳市人工智能语料券专项资金申请材料在线预审要点