新闻动态 你的位置:开云电竞(中国)官方网站 登录入口 > 新闻动态 > 开云(中国)Kaiyun·官方网站 - 登录入口更快的推理速率:基于寥落细心力机制-开云电竞(中国)官方网站 登录入口
开云(中国)Kaiyun·官方网站 - 登录入口更快的推理速率:基于寥落细心力机制-开云电竞(中国)官方网站 登录入口

发布日期:2025-04-23 06:54    点击次数:132


开云(中国)Kaiyun·官方网站 - 登录入口更快的推理速率:基于寥落细心力机制-开云电竞(中国)官方网站 登录入口

国产大模子,最近有点卷。

这不,,Qwen2.5 系列又双叒倏得更新了——

连气儿读三本《三体》不费劲,何况45 秒傍边就能完好意思回归出这 69 万 token 的主要内容,be like:

还真不是诈欺事儿,"大海捞针"施行深刻,这个全新的Qwen2.5-Turbo在 100 万 token 险阻文中有全绿的发扬。

也即是说,这 100 万险阻文里,有细节 Qwen2.5-Turbo 是真能 100% 捕捉到。

没错,Qwen2.5 系列新成员Qwen2.5-Turbo,这回主打的即是复古超长险阻文,何况把性价比卷出了花儿:

险阻文长度从 128k 扩张到1M,荒谬于 100 万个英文单词或 150 万个汉字,也即是 10 部长篇演义、150 小时语音纪录、30000 行代码的量。

更快的推理速率:基于寥落细心力机制,解决百万险阻文时,首字复返本事从 4.9 分钟缩短到了 68 秒,完满了4.3 倍加快。

要道是还低廉:0.3 元 /1M tokens。这意味着,在换取老本下,Qwen2.5-Turbo 不错解决的 token 数目是 GPT-4o-mini 的 3.6 倍。

看到这波更新,不少网友平直爆出了 ***:

有东说念主直言:这样长的险阻文这样快的速率下,RAG 如故由时了。

还有东说念主开启大赞特赞阵势:咫尺在开源鸿沟,Qwen 比 Llama 还值得期待了。

除了连气儿啃下 3 本长篇演义,Qwen 官方还展示了 Qwen2.5-Turbo 超长险阻文的更多实勤勉能。

比如快速掌捏一通盘这个词代码库的信息。

如 Demo 所演示,上传包含 Qwen-Agent 仓库中通盘代码文献的文本文献(13.3 万 token),只需几秒钟,大模子就能读十足部代码并准确输出多样细节。

用户:这个存储库中有哪些 Agent 子类?提供它们的文献旅途。

Qwen2.5-Turbo:

连气儿读 7 篇论文,完成论文分类、论文摘录,也不在话下:

咱们也本体测试了一下。不错看到,在莫得给任何辅导的情况下,Qwen2.5-Turbo 能准确掌捏不同论文的细节信息,并完成对比分析。

除了大海捞针施行以外,Qwen 团队还在更复杂的长文本任务上测试了 Qwen2.5-Turbo 的身手。

包括:

RULER:基于大海捞针的扩张基准,任务包括在无关险阻文中查找多"针"或回应多个问题,或找到险阻文中出现最多或最少的词。数据的险阻文长度最长为 128K。

LV-Eval:条件同期相识广大笔据片断的基准测试。Qwen 团队对 LV-Eval 原始版块中的评估标的进行了调遣,幸免因为过于严苛的匹配轨则所导致的假阴性效果。数据的险阻文长度最长为 128K。

Longbench-Chat:一个评价长文本任务中东说念主类偏好对王人的数据集。数据的险阻文长度最长为 100K。

效果深刻,在 RULER 基准测试中,Qwen2.5-Turbo 获取了93.1 分,越过了 GPT-4o-mini 和 GPT-4。

在 LV-Eval、LongBench-Chat 等更接近真确情况的长文本任务中,Qwen2.5-Turbo 在多量维度上高出了 GPT-4o-mini,何况约略进一步扩张到越过 128 tokens 险阻文的问题上。

值得一提的是,现存的险阻文长度扩张决策时常会导致模子在解决漫笔本时出现比较彰着的性能下落。

Qwen 团队也在漫笔本任务上对 Qwen2.5-Turbo 进行了测试。

效果深刻,Qwen2.5-Turbo 在大部分任务上显贵高出了其他险阻文长度为 1M tokens 的开源模子。

和 GPT-4o-mini 以及 Qwen2.5-14B-Instruct 比拟,Qwen2.5-Turbo 在漫笔本任务上的身手并不逊色,但同期能 hold 住 8 倍于前两个模子的险阻文。

此外,在推理速率方面,把握寥落细心力机制,Qwen2.5-Turbo 将细心力部分的诡计量压缩到了原本的 2/25,在不同硬件成就下完满了 3.2-4.3 倍的加快比。

咫尺,在 HuggingFace 和魔搭社区,Qwen2.5-Turbo 均提供了不错在线体验的 Demo。

API 奇迹也已上线阿里云大模子奇迹平台,跟 OpenAI API 是兼容的。

至于模子权重什么时候开源?

阿里通义开源认真东说念主林俊旸的说法是:咫尺还莫得开源规画,但正在致力于中。

归正 HuggingFace 连合独创东说念主 Thomas Wolf 是帮咱催上了(手动狗头)。

Demo 传送门:

https://huggingface.co/spaces/Qwen/Qwen2.5-Turbo-1M-Demo

https://www.modelscope.cn/studios/Qwen/Qwen2.5-Turbo-1M-Demo

参考通顺:

https://qwenlm.github.io/zh/blog/qwen2.5-turbo/开云(中国)Kaiyun·官方网站 - 登录入口



Powered by 开云电竞(中国)官方网站 登录入口 @2013-2022 RSS地图 HTML地图