中国电信何忠江发布千亿参数语义大模型“星辰”:年底前开源百亿模型

2023-11-10 16:20 运营商财经网讯

运营商财经网讯

今日,中国电信2023数字科技生态大会暨2023数字科技生态展”在广州盛大启幕,中电信人工智能科技有限公司何忠江总经理正式发布了“星辰”千亿参数的语义大模型。

据他表示,千亿模型的效果有了非常显著的提升,接下来还要通过量化蒸馏的手段,让模型能够低成本商用。 

同时,他也透露,中国电信的AI团队也将参与到开源开放的行列中,将于今年年底之前开源百亿模型,明年4月开源千亿模型,所有底层代码都会开源。同步中国电信还将开放超过1T的高质量清洗数据,以及各种基于星辰大模型底座的工具链,满足各类开放用户需求,同时技术团队会在线上对工具进行支持。

会上,何忠江还介绍了中国电信AI研发的多模态大模型,主要聚焦在提升图文生成、图文理解的能力。其中中国电信训练了超过12亿的各种风格数据,目前支持写实、彩墨画、赛博朋克等接近20种绘画风格,同时由于在训练中特意加强了语义和图像映射的attention学习,所以对于中文的理解,语义的细粒度理解,比目前市面上很多软件效果提升不少。 

他也强调,人工智能领域除了算力和算法,最核心的还有数据。 

一是支撑大模型数据语料的积累,目前已经完成了超500TB文本数据、12亿张图文数据、日采集2PB的视频数据的积累,并不断积极合作公共数据和行业优质数据,作为首家运营商单位加入中国大模型语料数据联盟。 

二是助力建设数据要素市场化发展,通过建设开放共享的隐私计算平台,吸引合作数据和技术伙伴入驻。目前在海南,已协助市政 府构建了“数据超市产品” ,中国电信作为独家运营方,促成了2000亿的数据资源汇聚,运营了超5亿的交易项目。

(责任编辑:康玲华)

运营商财经(官方微信公众号yyscjrd)—— 主流财经网站,一家全面覆盖科技、金融、证券、汽车、房产、食品、医药、日化、酒业及其他各种消费品网站。

分享至:
文章关键词: 中国电信 何忠江