米乐体育688首页
“前两届比赛我们实验室都有学长参加,并且拿到了不错的名次”,在“0x80”队的刘云峰看来,参加数据库大赛早已成为实验室的“传统”。刘云峰所在实验室的指导老师,电子科技大学计算机科学与工程学院研究员、博导段翰聪表示,“本届数据库大赛升级到国家级,对学生的影响力毋庸置疑。实验室有研一的同学参加了比赛,这也能证明我们国家在基础软件的训练和学习方面有更多年轻人在加入。”
虽然大模型发展如火如荼,但大模型高质量语料短缺已成为全球共性问题。公开资料显示,大模型对数据供给要求极高。比如,训练GPT-4和Gemini Ultra大概需要4万亿至8万亿个单词。麻省理工学院等高校研究人员预测,到2026年之前,机器学习数据集可能会耗尽所有可用的高质量语料数据。研究机构EpochAI亦公开表示,最早在2024年,人类就可能会陷入训练数据荒,届时全世界的高质量训练数据都将面临枯竭。OpenAI也公开表达过对数据告急的担忧。
数据作为新型生产要素,已深度融入生产、分配、流通、消费等各环节,深刻改变着生产方式、生活方式乃至社会治理方式。统计显示,2022年我国数字经济规模已超过50万亿元,数字经济占GDP比重达到41.5%,居世界第二位。如何充分实现数据要素价值,促进全体人民共享数字经济发展红利,成为当前的一个重要课题。
2013年2月,隆冬的戈壁滩上,习近平总书记冒着严寒参观了空军某试验训练基地部分装备,亲切接见了基地官兵和技术人员代表。“我一直惦记着大家,特地来看看大家。”看大家只穿了冬常服时,总书记当即表示“大家都没穿大衣,我也脱了吧”,说着便脱下大衣,和官兵们一起合影。2月的戈壁滩呵气成霜,总书记的话却让大家心里热乎乎的。