7月6日,在2023世界人工智能大会开幕式上,由上海人工智能实验室、中央广播电视总台、人民网、国家气象中心、中国科学技术信息研究所、上海报业集团、上海数据集团、上海市数商协会等单位联合发起的大模型语料数据联盟正式成立。
据介绍,共筑Al生态圈是人工智能产业发展的基础,一个数据创造数据、知识创造知识的时代即将开启。联盟将链接模型训练、数据供给、学术研究、第三方服务等多方面机构,联合打造多知识、多模态、标准化的高质量语料数据,探索形成基于贡献、可持续运行的激励机制,力争打造国际化、开放型的大模型语料数据“朋友圈”。
上海报业集团拥有十余家具有全国影响力的国有权威媒体机构和文化出版机构,积累了海量的跨行业中文权威高质量数据资源。这些语料数据时间跨度长,来源广泛,涵盖政治、经济、文化、科技、社会、生态等不同领域,符合中文语言文字规范和标准。拥有符合核心价值观的内容丰富的主旋律语料库,具备正确的政治方向、舆论导向、价值取向。
据了解,联盟成立后,将进一步深化运营机制,推进标准化机制、认证机制、合作标注机制等建设,聚焦重点预料数据开展攻关,研究解决大模型发展共性问题,引导大模型依法依规发展。