当前位置: 首页 > 产经 > > 内容页

聚焦场景应用 加快发展人工智能

时间:2023-08-24 20:50:59 来源:人民邮电报 分享至:


(资料图片)

在连续对话中“理解”问题,快速搜索并归纳答疑;根据文字描述和适度“联想”,秒绘细节感满满的画作;从面向搜索引擎编程到面向大模型编程,高效调代码、修漏洞……近期,密集发布的大模型掀起了生成式人工智能热潮,展现了大语言模型在学习交互和内容生成方面的强大能力,引发热议。

大模型持续火热,正引发新一轮智能化浪潮。得益于庞大的算力支持、巨量的训练数据和模型结构的优化,大模型应用不断给人们带来惊喜。从与人连续对话畅聊到写小说、整理会议纪要,从通读最新论文归纳摘要到辅助创作剧本、编写网页脚本代码……生成式人工智能加速进化,正变身成为“超级生产者”和人类的工作助手。随着技术迭代,响应速度快、输出“干货”多的大模型将渗透到越来越多的领域,模型即服务(MaaS)——利用云计算和大数据平台提供预先训练好的机器学习模型和相关接口的服务,也将变成人工智能赋能行业应用的新范式。人工智能大模型强大的基础能力和与行业应用结合的创新潜力,使全球科技“大厂”纷纷加码入局。

网络基础优势、算力和存力的提升为我国人工智能发展打下了坚实基础,我国人工智能大模型呈现出蓬勃发展态势。《中国人工智能大模型地图研究报告》显示,截至目前,10亿级参数规模以上的大模型全国已发布79个。我国在大模型方面已建立起涵盖理论方法和软硬件技术的体系化研发能力。但也应注意到,人工智能大模型涉及软硬件关键技术、重点领域产业应用等多方面融合创新,从模型发布到让垂直行业用起来,还需聚焦应用场景需求、瞄准难点痛点,以通用大模型为基础,结合行业数据集训练通信、医疗、教育等专业领域的行业大模型。要以解决实际问题为重点,高质量应用大模型,助力产业数字化智能化转型。

“投喂”给大模型的数据质量直接影响其“聪明”程度。高质量的训练数据可以帮助模型更好理解数据的特征和模式,有利于提高模型的泛化性能和学习能力。此外,训练数据集的分布特征和多样性也会影响大模型的能力。如果模型训练使用的数据与实际应用场景存在较大差异,那么模型在实际应用时的性能可能会下降。因此,高质量的公开数据对于提供多样化训练数据、提高模型的适应性和泛化能力具有重要意义。前不久印发的《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023—2024年)》提出,“建立多模态公共数据集,打造高质量中文语料数据”。期待各地各行业从实际出发,加强高质量数据供给,为大模型成长提供充足“养料”。

大模型的研发需要大量的资金投入和算力支持,入局门槛颇高。中国在算力总规模上可与美国相比,但跨数据中心的算力协同还面临体制机制的挑战,不少智算中心算力利用率和效率不高。对此,中国工程院院士邬贺铨建议在国家科技与产业计划的协调下合理分工形成合力,开放国家实验室的算力平台支持各类大模型训练,同时建议组建算力联盟,集中已有高档GPU算力资源,提供大模型数据训练所需算力。近日开始施行的《生成式人工智能服务管理暂行办法》提出,推动生成式人工智能基础设施和公共训练数据资源平台建设。促进算力资源协同共享,提升算力资源利用效能。此外,我国在大模型开发方面作为追赶者,有必要进一步强化企业科技创新主体地位,聚焦关键领域、加强产学研合作,推动人工智能赋能各行业各领域发展。

标签:

Copyright ©  2015-2022 上海网版权所有  备案号:京ICP备2022022245号-14   联系邮箱:435 226 40@qq.com