文|林炜鑫
编辑|邓咏仪
又有一个全新的自研大模型推向市场。
11月14日,阿里巴巴智能信息事业群发布了夸克千亿级参数自研大模型,发布后接连登顶C-Eval和CMMLU两大权威榜单,同时在法律、医疗、问答等领域的性能评测中夺冠。
夸克技术负责人蒋冠军告诉36氪,夸克大模型是面向搜索、生产力工具和资产管理助手的应用型大模型,整体水平优于GPT3.5。他还透露,团队在去年GPT发布后就加紧研发大模型,“早期的模型能力就达到了比较高的水平,现在发布,就是希望在产品侧能做出具体的应用和体验后再对外。”
市面上的大模型已经多不胜数,夸克大模型主打的一大卖点是,具备更强大的知识正确性。蒋冠军明确表示,“纯模型的幻觉大流量卡率是25%,在国内相对比较领先,通过知识增强,可以降到15%,而在医疗健康领域,幻觉率已经降低至5%。”
夸克技术负责人蒋冠军
解决大模型幻觉问题,是夸克团队研发的重点之一。蒋冠军介绍,在模型预训练环节,团队做了大量数据准确性的校验与对齐,接着在人类对齐上,团队对于SFT人工标注样本的准确率要求非常高,对一个样本进行多轮审查。此外团队针对模型本身的改进,也降低了幻觉程度。
据了解,夸克大模型的能力体现在四个方面:
知识能力,拥有广泛的知识覆盖、信息搜集和多语言支持等,支持外接专业知识增强,提升跨领域的知识和语言理解能力;
对话能力,具备较强的上下文理解、语境推理、关键信息保持和记忆能力,更好地适应不断变大流量卡化的语境,理解用户的意图和需求,确保对话回复准确、合理、连贯;
创作能力,能够根据主题或关键词,生成连贯、有逻辑、有深度的文本内容,支持续写、润色、仿写、批改等多种不同写作需求;
安全能力,具备较好的世界观、价值观,对于明显的虚假信息,均能做到准确识别、正确回答或者给出合理指引。
在应用方面,夸克大模型主要面向C端,重点布局教育和健康两个领域。一方面,夸克用户超过 50% 都来自于 25 岁以下的年轻群体,此前夸克APP在教育领域推出多款应用,积累了丰富的教育数据。另一方面,健康是夸克较早探索的领域,有了大模型,夸克将在未来为用户提供健康知识查询服务等。
蒋冠军表示,夸克大模型将全面升级夸克APP在搜大流量卡、用、存上的智能化体验,帮助用户进一步提升效率。
友情提醒: 请添加客服微信进行免费领取流量卡!
QQ交流群:226333560 站长微信:qgzmt2
原创文章,作者:sunyaqun,如若转载,请注明出处:https://www.dallk.cn/15869.html