本赛题主要考察文本语义相似度自动评估能力。参赛者需要利用大模型技术,基于标准答案对预测结果进行评分。
本赛题构建了对话数据集,并提供丰富的法律条文库、知识库等作为检索参考,以评估预训练模型在法律领域不同难度任务上的检索与生成能力。
本赛题聚焦于运用无人机航拍技术(航片)对玉米全生育期进行监测,通过图像处理与机器学习算法,精准识别玉米生长过程中的异常情况。
本次比赛旨在开发一个智能问答助手。这个助手将能够准确回答用户关于TuGraph-DB的各类问题,包括使用方法、功能特性、技术细节等,从而为TuGraph-DB的用户和开发者提供更好的支持。
本赛题旨在挑战参赛者将OCR(Optical Character Recognition)模型在TPU(Tensor Processing Unit)平台上进行量化转换,实现其在端侧设备上的高效运行。
如何设计文档解析、知识库生成、文本召回的策略,以更准确地向大模型提供用户问题对应的答案信息,具有重要的研究价值和实际意义。本赛题要求选手使用运营商相关的文档构建知识库,根据用户问题检索知识库并返回答案
如何通过每一种图查询语言现有的少量语料,微调出一个可以高质量的将自然语言翻译成对应图查询语言的大模型,并以此降低图数据库的使用门槛,成为了现阶段的一个重要研究方向。
参赛者将在东方国信幕僚智算云平台上使用Intel Gaudi AI加速卡,编写LoRA微调和推理脚本。具体任务包括使用ChatGLM3-6B模型和给定的数据集进行微调,并在微调后的模型上执行推理任务。
本赛题旨在推动参赛者在CORAL基准测试数据集上开发和训练自己的对话式检索增强生成模型,以此向更具现实意义的多轮Conversational RAG场景迈进。
本赛题要求选手基于自主研发的FlashRAG-MindSpore框架,面向不同类型的用户问题构建一个智能的RAG系统,助力大模型技术在实际场景中的创新应用。
客服中心每天都需要接通大量的客户来电,客户来电需要进行语音转文本,同时对文本进行概括,提取客户核心诉求,但是人工总结会增加客服工作量,降低工作效率,因此期望使用AI算法进行自动的文本摘要生成。
由于工业场景特性,存在目标过小、物体区分度不明显、周围背景复杂等问题,给正确识别带来较大的挑战,目前,业界平均识别正确率维持在80%左右,存在进一步优化和提升的空间。