里番
在国产数据库市场,培养人才无疑是提升竞争力的关键。当下,加快国产数据库核心人才的培养已经成为迫在眉睫的需求。“OceanBase初创之时,国内数据库内核研发人才短缺,我们引进了一批最优秀的毕业生自己培养,虽然毕业生经验不多,但通过自己的努力很快便成为国产数据库的中坚力量。”OceanBase首席技术官杨传辉谈到,“14年过去,OceanBase在自研数据库领域已拥有一定领先优势,我们希望通过持续举办、长期投入数据库大赛,来加速中国数据库内核人才培养的步伐。”
“一开始,数智人说话时,身体总是在摇晃,还不会眨眼睛。”华东师大软件工程学院工程师徐刚负责蒋院士数智人的形象驱动部分,他告诉记者,由于蒋院士生前视频资料多为公开场合的讲座、演讲、发言等,表情相对正式,所以机器对其形态进行学习时,往往捕捉不到“眨眼睛”这个动作。后来,团队成员一方面联系家属收集院士的日常生活视频,另一方面修改后台算法,解决数智人说话时眼神和身体不自然的问题。里番
虽然大模型发展如火如荼,但大模型高质量语料短缺已成为全球共性问题。公开资料显示,大模型对数据供给要求极高。比如,训练GPT-4和Gemini Ultra大概需要4万亿至8万亿个单词。麻省理工学院等高校研究人员预测,到2026年之前,机器学习数据集可能会耗尽所有可用的高质量语料数据。研究机构EpochAI亦公开表示,最早在2024年,人类就可能会陷入训练数据荒,届时全世界的高质量训练数据都将面临枯竭。OpenAI也公开表达过对数据告急的担忧。里番
电子科技大学“边缘OB”队的王冠骅用“计算机科学皇冠上的一颗明珠”来形容自己心中的数据库。王冠骅和两位队友刚升到研一,参加比赛后3人都感受到了实打实的助益。“一方面是从专业角度来看,面对大型项目如何调试,怎么通过看日志解决问题,学到了更多思路;另一方面是心态上的变化,无论遇到多大困难都不要放弃,最后一秒都有可能出奇迹。”队员庞泽云说。里番(撰稿:耿芝斌)