10月30日,凤凰智媒与香港中文大学宣布推出全球首个专为粤语而设的动态评测平台及生态系统CLEVA-Cantonese。凤凰卫视旗下人工智能数据服务机构——凤凰智媒为其提供了第一批高质量粤语数据。这个创新平台通过提供公平、动态且具参考价值的基准评估,揭示各类大语言模型对粤语的支持程度,并为研究人员及开发者提供具参考价值的分析,加速粤语大语言模型的优化及实际应用。
此前,港中大语言与视觉实验室研发的CLEVA(Chinese Language Models EVAluation Platform)是目前公认规模最大、涵盖最全面的中文大语言模型评估基准之一。CLEVA-Cantonese在此基础上,建立全球首个持续演进的粤语大语言模型评估生态系统。发布会上港中大计算机科学与工程学系助理教授、语言与视觉实验室负责人及CLEVA项目负责人王历伟教授介绍:此次系统平台整合了一个协作式的自动化工作流程,涵盖四个关键阶段:数据导入和筛选、语言模型理解、评估与反馈。这个持续循环的流程能实时提供洞见、推动模型创新、提升对粤语社群的服务质量,并产出可帮助其他低资源语言评测的研究成果。
粤语是香港、广东及海外华人生活地区的重要语言,但由于粤语语音语义的繁复多样、口语和文字的巨大差异、以及独特的文化背景等原因造成大模型对粤语的理解和支持能力较为欠缺。同时,粤语是低资源语言,语料库有限,所以收集更多高质量的数据,是提升大模型能力的基础条件。凤凰智媒一直致力于挖掘凤凰卫视多年积累的媒体数据资源价值,并且已经发布了一批具有香港地域特点和国际多元文化传播价值的高质量华语数据集。此次凤凰智媒发挥凤凰传媒行业对于语言理解能力和丰富多样的及时语料数据的优势,整理了各类场景具有特色的本港粤语口语数据,并进过人工标注、校验后参与投入了此评测平台的构建科研工作。随着评测平台的不断迭代和落地应用的普及,未来将在引导粤语环境下的研发与产品规划,助力粤语在教育、医疗、公共服务及文化生活等方面提供安全可信的模型,也将依托人工智能大模型的应用为粤语文化的传播起到积极帮助。
