由大学根本模子研究核心结合中关村尝试室研制的SuperBench大模子分析能力评测框架,文心一言4.0跨越GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。正式对外发布2024年3月版《SuperBench大模子分析能力评测演讲》。正在中文推理、中文言语等评测上遥遥领先,Claude-3仅列第四。正在语义理解中的数学能力上,成果显示:文心一言4.0中文理解、数学等多能力全球第一。国内模子文心一言4.0表示亮眼,排正在中下逛,较着掉队第一梯队;和其他模子拉显差距。
正在企业选择大模子最看沉的平安性评测上,力压国际一流模子GPT-4系列模子和Claude-3拿下最高分(89.1分)!