当前简讯:北京:系统构建大模型等通用人工智能技术体系
5月30日,北京市政府办公厅正式发布《北京市促进通用人工智能创新发展的若干措施》。其中提出,系统构建大模型等通用人工智能技术体系。开展大模型创新算法及关键技术研究,鼓励开源技术生态建设。构建数据管理平台相关系统,研发数据清洗、标注、分类、注释及内容审查等算法及工具。构建多模态多维度的基础模型评测基准及评测方法,建设自动评测开放服务平台。支持研发分布式训练系统、编译器及人工智能芯片自动化评测系统,推动基础软硬件广泛适配。持续探索通用智能体、具身智能和类脑智能等通用人工智能新路径。
措施全文
北京市促进通用人工智能创新发展若干措施
(资料图)
为贯彻落实《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》,充分发挥政府引导作用和创新平台催化作用,整合创新资源,加强要素配置,营造创新生态,重视风险防范,推动本市通用人工智能实现创新引领和理性健康发展,特制定以下措施。
一、提升算力资源统筹供给能力
(一)组织商业算力满足紧迫需求
着力发挥本市算力资源优势,实施算力伙伴计划,通过与云厂商加强合作,加快归集现有算力,明确供给技术标准、软硬件服务要求、算力供给规模和支持措施,为创新主体提供多元化优质普惠算力,保障人工智能技术创新和产品研发算力需求。
(二)高效推动新增算力基础设施建设
将新增算力建设项目纳入算力伙伴计划,加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心,形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、大型视觉模型、多模态大模型、科学计算大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发。
(三)建设统一的多云算力调度平台
针对弹性算力需求,通过建设多云算力调度平台,实现异构算力环境统一管理、统一运营,便利创新主体在不同云环境上无缝、经济、高效地运行各类人工智能计算任务。进一步优化本市与天津市、河北省、山西省、内蒙古自治区等区域算力集群的直连基础光传输网络,提高环京地区算力一体化调度能力。
二、提升高质量数据要素供给能力
(四)归集高质量基础训练数据集
组织有关机构整合、清洗中文预训练数据,形成安全合规的开放基础训练数据集;持续扩展多模态数据来源,建设高质量的文字、图片、音频、视频等大模型预训练语料库,支持在依法设立的数据交易机构开展数据流通、交易。
(五)谋划建设数据训练基地
加快建设数据基础制度先行先试示范区,探索打造数据训练基地,推动数据要素高水平开放,提升本市人工智能数据标注库规模和质量。鼓励开展内容信息服务的互联网平台提供高质量语料数据,供创新主体申请使用。探索基于数据贡献、模型应用的商业化场景合作。
(六)搭建数据集精细化标注众包服务平台
以众包服务方式,建设数据集精细化标注平台,开发智能云服务系统,集成相关工具应用。鼓励并组织来自不同学科的专业人员参与标注多模态训练数据及指令数据,提高数据集质量。研究平台激励机制,推动平台持续良性发展。
三、系统构建大模型等通用人工智能技术体系
(七)开展大模型创新算法及关键技术研究
围绕模型构建、训练、调优对齐、推理部署等环节,积极探索基础模型架构创新,研究大模型高效并行训练技术和认知推理、指令学习、人类意图对齐等调优方法,研发支持百亿参数模型推理的高效压缩和端侧部署技术,形成完整高效的技术体系,鼓励开源技术生态建设。
(八)加强大模型训练数据采集及治理工具研发
围绕训练数据“采、存、管、研、用”等环节,研究互联网数据全量实时更新技术、多源异构数据整合与分类方法,构建数据管理平台相关系统,研发数据清洗、标注、分类、注释及内容审查等算法及工具。
(九)建设大模型评测开放服务平台
鼓励第三方非盈利机构构建多模态多维度的基础模型评测基准及评测方法;研究人工智能辅助的模型评测算法,开发包括通用性、高效性、智能性、鲁棒性在内的多维度基础模型评测工具集;建设大模型评测开放服务平台,建立公平高效的自适应评测体系,根据不同目标和任务,实现大模型自动适配评测。
(十)构建大模型基础软硬件体系
支持研发大模型分布式训练系统,实现训练任务高效自动并行。研发适用于模型训练场景的新一代人工智能编译器,实现算子自动生成和自动优化。推动人工智能训练推理芯片与框架模型的广泛适配,研发人工智能芯片评测系统,实现基础软硬件自动化评测。
(十一)探索通用人工智能新路径
发展面向通用人工智能的基础理论体系,加强人工智能数学机理、自主协同与决策等基础理论研究,探索通用智能体、具身智能和类脑智能等通用人工智能新路径。支持价值与因果驱动的通用智能体研究,打造统一理论框架体系、评级标准及测试平台,研发操作系统和编程语言,推动通用智能体底层技术架构应用。推动具身智能系统研究及应用,突破机器人在开放环境、泛化场景、连续任务等复杂条件下的感知、认知、决策技术。支持探索类脑智能,研究大脑神经元的连接模式、编码机制、信息处理等核心技术,启发新型人工神经网络模型建模和训练方法。
四、推动通用人工智能技术创新场景应用
(十二)推动在政务服务领域示范应用
围绕政务咨询、政策服务、接诉即办、政务办事等工作,利用人工智能在语义理解、自主学习和智能推理等方面的能力优势,提高政务咨询系统智能问答水平,增强“京策”平台规范管理和精准服务能力,辅助市民服务热线高效回应市民诉求,推进政务办事精准指引和高效审批。
(十三)探索在医疗领域示范应用
支持有条件的研究型医疗机构提炼智能导诊、辅助诊断、智能治疗等场景需求,充分挖掘医学文献、医学知识图谱、医学影像、生物学指标等多模态医疗数据,会同人工智能创新主体开发智能应用,实现对症状、体征和专病的精准识别与预测,提升疾病诊断、治疗、预防及全病程管理的智能化水平。
(十四)探索在科学研究领域示范应用
发展科学智能,加速人工智能技术赋能新材料和创新药物领域科学研究。支持能源、材料、生物领域相关实验室设立科研合作专项,与人工智能创新主体开展联合研发,充分挖掘材料、蛋白质和分子药物领域实验数据,研发科学计算模型,开展新型合金材料、蛋白质序列和创新药物化学结构序列预测,缩短科研实验周期。
(十五)推动在金融领域示范应用
系统布局“揭榜挂帅”项目,推动金融机构进一步开放行业应用场景;支持金融科技创新主体聚焦智能风控、智能投顾、智能客服等环节,研发金融专业长文本精准解析建模技术、复杂决策逻辑与模型信息处理融合技术,支撑金融领域投资辅助决策。
(十六)探索在自动驾驶领域示范应用
支持自动驾驶创新主体研发多模态融合感知技术,基于车路协同数据和车辆行驶多传感器融合数据,提高自动驾驶模型多维感知预测性能,有效解决复杂场景长尾问题,辅助提高车载自动驾驶模型泛化能力。支持在北京市高级别自动驾驶示范区3.0项目建设中,开放车路协同自动驾驶数据集。开展基于低时延通讯的云控自动驾驶模型测试,探索自动驾驶新技术路径。
(十七)推动在城市治理领域示范应用
支持人工智能创新主体结合智慧城市建设场景需求,率先在城市大脑建设中应用大模型技术,加快多维感知系统融合处理技术研发,实现智慧城市底层业务的统一感知、关联分析和态势预测,为城市治理决策提供更加综合全面的支撑。
五、探索营造包容审慎的监管环境
(十八)持续推动监管政策和监管流程创新
探索营造稳定包容的监管环境,鼓励创新主体采用安全可信的软件、工具、计算和数据资源,开展人工智能算法、框架等基础技术的自主创新、推广应用、国际合作。争取在中关村国家自主创新示范区核心区先行先试,推动实行包容审慎监管试点。
(十九)建立常态化服务和指导机制
对具有舆论属性或社会动员能力的人工智能相关互联网信息服务,开展常态化联系服务,指导创新主体引入技术工具进行安全检测、按规定申报安全评估、履行算法备案等程序。
(二十)加强网络服务安全防护和个人数据保护
指导创新主体加强网络和数据安全管理,落实网络安全、数据安全和个人信息保护主体责任,强化安全管理制度建设和工作落实。鼓励创新主体开展数据安全管理认证及个人信息保护认证,落实数据跨境传输安全管理制度,全面提升网络安全和数据安全防护能力。
(二十一)持续加强科技伦理治理
加强人工智能伦理安全规范及社会治理实践研究。建设通用人工智能领域科技伦理治理公共服务平台,服务政府监管,促进行业自律。开展科技伦理审查及相关业务培训,强化各责任主体科技伦理规范意识。深入开展科技伦理教育和宣传,构建良好人工智能科技伦理氛围。
(文章来源:界面新闻)
关键词: