Yi 大模型是由零一万物公司推出的一系列大语言模型。以下是关于 Yi 大模型的一些主要特点和相关信息:
- 模型版本:
- Yi-34b:在 Hugging Face 英文测试公开榜单 Pretrained 预训练开源模型排名中表现强劲,各项性能分数较高,位列全球第一。同时,在 C-Eval 中文权威榜单排行榜上也超越了全球所有开源模型。该模型还发布了全球最长、可支持 200k 超长上下文窗口(context window)版本,能处理约 40 万汉字超长文本输入。
- Yi-6b:也是零一万物开源发布的 Yi 系列模型中的一个版本。
- 功能与应用:
- 通用功能:支持通用聊天、问答、对话、写作、翻译等。例如,在日常的交流场景中,能准确理解用户的问题并给出恰当的回答,在写作方面可以提供文章创作的思路、内容等。
- 长文本处理:像 yi-34b-chat-200k 模型可以处理 200k 上下文,适合多篇文档内容理解、海量数据分析挖掘和跨领域知识融合等。比如金融分析师可以用它快速阅读报告并预测市场趋势;律师可以用它精准解读法律条文;科研人员可以用它高效提取论文要点等。
- 多模态支持:Yi 大模型中的 yi-vl-plus 模型,可支持文本、视觉多模态输入,面向实际应用场景大幅增强 charts、table、infographics、screenshot 识别能力,支持复杂图表理解、信息提取、问答以及推理。其在 yi-vl 基础上进一步提高图片分辨率,模型支持 1024*1024 分辨率输入,显著提高生产力场景中文字、数字 OCR 的准确性,同时保持了 LLM 通用语言、知识、推理、指令跟随等能力。在一些中文图表理解场景中,比 GPT-4V 准确率更高。
- 性能优势:
- 在斯坦福大学研发的大语言模型评测 AlpacaEvaLeaderboard 中,yi-34b-chat 以高胜率在 Alpaca 经认证的模型类别中,成为世界范围内仅次于 GPT-4 英语能力的大语言模型,也是经由 Alpaca 官方认证为数不多的开源模型。
- 在加州大学伯克利分校主导的 LMSYSORG 排行榜中,yi-34b-chat 以较高的 elo 评分,晋升最新开源 SOTA 开源模型之列,性能表现追平 GPT-3.5。
- 在《SuperClue 中文大模型基准评测报告 2023》中,yi-34b-chat 在多项基准评测中的“SuperClue 大模型对战胜率”这项关键指标上取得了一定胜率,仅次于 GPT4-Turbo。
总的来说,Yi 大模型在语言处理能力、多模态支持以及性能表现等方面都有一定的优势和特点,为开发者和用户提供了强大的人工智能技术支持和丰富的应用可能性。
免责声明:本网站仅提供网址导航服务,对链接内容不负任何责任或担保。