89949,com
虽然大模型发展如火如荼,但大模型高质量语料短缺已成为全球共性问题。公开资料显示,大模型对数据供给要求极高。比如,训练GPT-4和Gemini Ultra大概需要4万亿至8万亿个单词。麻省理工学院等高校研究人员预测,到2026年之前,机器学习数据集可能会耗尽所有可用的高质量语料数据。研究机构EpochAI亦公开表示,最早在2024年,人类就可能会陷入训练数据荒,届时全世界的高质量训练数据都将面临枯竭。OpenAI也公开表达过对数据告急的担忧。
1月初,北京最冷的时候,气温跌破冰点,平谷区南独乐河镇的北京市农林科学院北京油鸡资源保种场里,北京油鸡在“科技舍”里温暖过冬。每只北京油鸡今天食量多少、粪便好不好、叫声是否正常……北京油鸡资源保种场场长曾另超每天都会操心这些事,因为这些油鸡肩负着重任——为北京油鸡品种资源保护、品种选育、科学试验提供保障。
北京油鸡距今已有近300年历史,三黄、三毛、五趾,外观颇具辨识度,口感也很特别。北京油鸡脂肪沉积丰富,肉蛋品质优良,是优质肉蛋兼用型鸡种,鸡蛋卵磷脂含量比普通鸡蛋高30%。由于养殖数量急剧下降,曾经一度濒危,2022年北京油鸡保种场在平谷区南独乐河镇建成投产,首批5000只油鸡从河北的基地“回家”。
梁燕以新颖的学术视角和一贯的钻研精神,引领着学生们翻译了海外学者对中国戏曲的研究成果。她耗时三年主持完成的8卷本《海外中国戏曲研究译丛》,涵盖了俄、日、德、英、意、法等6个语种。其中有俄罗斯学者关于中国明杂剧的研究,有现代日本学者关于梅兰芳1919年访日演出的记述,有德国学者关于齐如山的系统研究,有挪威学者关于易卜生及其剧作在中国的影响与接受研究,有意大利学者关于中国戏曲历史的叙述,有18、19世纪英美文学与戏剧中关于中国戏曲的评论,有法国学者关于中国元杂剧作品的研究,有当代北美学者关于清代戏曲作家李渔的专论。