本赛题主要考察文本语义相似度自动评估能力。参赛者需要利用大模型技术,基于标准答案对预测结果进行评分。
2025/06/25 14:07:34 大模型驱动文本语义相似度智能评估训练集数据件:V1 查看详情
该数据件数据涵盖医疗、金融和文体等多个领域,每条数据包含四个字段:标准答案、预测结果、内容完备性评分及语义一致性评分,共1000条。
2025/07/31 11:04:41 大模型驱动文本语义相似度智能评估test-B数据件:V1 查看详情
该数据件数据是B榜的评测数据,共500条。
2025/06/25 14:08:51 大模型驱动文本语义相似度智能评估test-A数据件:V1 查看详情
该数据件数据是A榜的评测数据,共500条。
2025/07/05 13:52:10 submit sample 下载文件
提交实例 - MD5: 442e71eb0f476ca1009ad238dfc58616