新闻
你的位置:九游体育(JIUYOU) 中国大陆大陆官网-登录入口 > 新闻 >过年关啦!阿里奉上了本年终末一份礼物——九游体育app娱乐
"眼睛"模子 QVQ,其中 V 代表视觉。它只需读取图像和教唆,就不错运搬动念考。
I ’ m watching you!
据先容,这可能是各人第一个视觉推理模子,也不错把它领略为上个月开源的阿里版 o1 模子 QwQ 的视觉版块。
不错搞定数死字生等各界限问题。
读梗图、数鸭子也不在话下。
现在该模子处于现实阶段,洞开测试。
后果可能因为探访过多,网页一度还 404 了。
从性能发达上看,QVQ 在 MMMU 上的得分为 70.3,这一后果跨越 GPT-4o、Claude 3.5 Sonnet,但比 o1 模子还差了那么小数。
官方给了几个演示 Demo,让我们好好感知一下它的推理材干。
最初来看这谈数学题。
解题念念路如下:
再来个几何题,算算这个沙发的面积。
它的推理经过如下:
高中化学题:图片中的滤液 E 是什么化学物资?
它的谜底是:硫酸亚铁溶液。
他们在四个数据集对眼睛模子 QVQ-72B-Preview 进行了评估,包括 MMMU、MathVista、MathVision、OlympiadBench,主要磨真金不怕火数学多模态推理以及轮廓领略推理方面的材干。
QVQ-72B-Preview 在 MMMU 基准测试中获得了 70.3 分,大大跨越了其前身 Qwen2-VL-72B-Instruct。
此外,在其余三个以数学和科知识题为要点的基准测试中,该模子也发达出了超卓的性能,削弱了与 o1 模子之间的差距。
不外现在该模子属于是团队的现实征询模子,不是特地剖释,有几个截止需要提防。
话语混杂和代码切换:该模子可能会随机地混杂话语或在话语之间切换,从而影响回答的了了度。
递归推理:模子可能会堕入轮回逻辑情景,产生冗长的复兴而无法得出论断。
安全停战德方面的沟通:该模子需要加强安全模范,以确保性能可靠和安全,用户在部署时应严慎。
性能和基准截止:尽管该模子在视觉推理方面有所改良,但它不可全齐取代 Qwen2-VL-72B-Instruct 的功能。此外,在多法子视觉推理经过中,模子可能会逐渐失去对图像本色的善良,从而导致幻觉。
好好驻防针打了,那我们淡淡实测一波。
比如这谈考验谷歌版 o1 的题目:
若何欺诈这些数字加起来即是 30?
后果它识别出来了这几个球对应的数字,没特意志到 9 号球不错翻转成 6 号球,然后就堕入无限的念念考之中。。。
在 blog 终末,他们也泄漏了接下来的策画——增强视觉话语基础模子,使其具备基于视觉信息进行深度念念考和推理的高档材干。
把时辰拉长,他们诡计是将更多的模态整合到融合的模子中,概况应酬复杂的挑战并参与科学探索。
(模子至极是 AI For Science?)
参考继续:
[ 1 ] https://x.com/Alibaba_Qwen/status/1871602879972405626
[ 2 ] https://qwenlm.github.io/blog/qvq-72b-preview/
— 完 —
点这里� � 善良我,铭记标星哦~
一键三连「共享」、「点赞」和「在看」
科技前沿进展日日再会 ~
下一篇:九游体育娱乐网在 MEET 2025 智能改日大会大会现场-九游体育(JIUYOU) 中国大陆大陆官网-登录入口
- 2025/02/04九游体育app娱乐硅宝科技1月13日融券偿还0股-九游体育(JIUYOU) 中国大陆大陆官网-登录入
- 2025/02/04现金九游体育app平台现时融资余额3.92亿元-九游体育(JIUYOU) 中国大陆大陆官网-登录入口
- 2025/02/04九游体育app娱乐占当日买入金额的10.53%-九游体育(JIUYOU) 中国大陆大陆官网-登录入口
- 2025/02/03九游体育娱乐网金融ETF(510230)跌超0.9%-九游体育(JIUYOU) 中国大陆大陆官网-登
- 2025/02/03九游体育app官网近10日净流入额近2亿元-九游体育(JIUYOU) 中国大陆大陆官网-登录入口