8090要玩网 手游攻略 新游动态 Mistral的第一个多模式模型Pixtral 12B!或只是释放24GB磁性链接

Mistral的第一个多模式模型Pixtral 12B!或只是释放24GB磁性链接

时间:2025 07 30 13:36:40 来源:未知 浏览:0

老铁们,大家好,相信还有很多朋友对于Mistral的第一个多模式模型Pixtral 12B!或只是释放24GB磁性链接和的相关问题不太懂,没关系,今天就由我来为大家分享分享Mistral的第一个多模式模型Pixtral 12B!或只是释放24GB磁性链接以及的问题,文章篇幅可能偏长,希望可以帮助到大家,下面一起来看看吧!

训练后,直接转到模型。

我们都知道,米斯特拉尔团队一直“苛刻,不说话太多”。昨天下午,他们没有任何注释就抛出了磁性链接。

解析此链接后,您可以看到大小总计为23.64 GB,其中包含4个文件,其中最大的是封装的多模式。

快速移动的非正式米斯特拉尔社区将模型上传到了拥抱的脸上。

MAGNET:发布吸引了很多赞美。有些人将其与最近出现在热门话题上的反射模型进行了比较,该模型完全展示了Mistral团队以脚踏实地的方式进行事情的风格:

Pixtral 12b规格和性能

该模型的名称是Pixel-12b-240910。从名称中也可以看出该模型的参数数量为12B。

其中params.jsom列出了模型的相关参数:

如您所见,该模型具有支持10241024尺寸图像的视觉编码器,具有24个隐藏层,并支持高级图像处理。

该型号有40层,14,336个隐藏尺寸和32个注意力头。

Mistral的第一个多模式模型Pixtral 12B!或只是释放24GB磁性链接

此外,Pixtral 12b的词汇具有131,072个不同的令牌,可以说这很大,因此它可以实现非常微妙的语言理解和产生。

从这些参数和配置中也可以看出,PixTral 12b至少具有处理文本和图像数据并实现多模式处理的能力。

PixTral 12B的发布受到了良好的接收,因为人们一直期望开放的模型社区也可以获取易于使用的多模式模型。 Mistral这种磁性链接将我们朝这个方向迈出了一步。

但是,由于该模型刚刚发布,因此它的有效性仍然不清楚,但幸运的是,我们并没有完全没有线索。就在昨天,米斯特拉尔(Mistral)举行了一次峰会,米斯特拉尔(Mistral AI)峰会,包括米斯特拉尔(Mistral)首席执行官亚瑟·蒙斯(Arthur Mensch)和NVIDIA首席执行官Jen Hung在内的演讲者。

在此幻灯片中,我们可以看到Pixtral 12b支持任何大小的图像和128K上下文窗口。此外,该模型还可以处理包含文本和图像的大型文档。

在特定的性能指标方面,尽管PixTral 12b的性能不如GPT-4O和Claude-3.5十四行诗的性能,但它超过了每个基准中的Claude-3 Haiku和Gemini-1.5 8B。

在几种开放的多模式模型中,PixTral在大多数基准测试中表现最佳,仅在DOCVQA上略低于Qwen2 7b。

米斯特拉尔(Mistral)显示了一些特定的pixtral申请案例。

通过OCR将包含数学公式的科学文章的图片转录为降价格式?没有压力!

识别涂抹的手写内容是没有问题的。

Mistral的第一个多模式模型Pixtral 12B!或只是释放24GB磁性链接

提取图像信息并描述图像内容?这已经是多模型模型的基本能力,因此没有问题。

不仅如此,Pixtral可以理解更复杂的图像,并从中提取关键信息和见解:

Pixtral还具有出色的解释和推理能力。就特定指标而言,PixTral 12B的MMMU和MathVista上的多模式知识和推理性能领先于其他参与比较的模型(主要是开放模型,没有GPT-4O和Claude-3.5十四行诗)。多模式的问答性能也很棒,并且处于领先地位。

在某些指标中,多模式的说明合规性和文本理解都很好,并且仅略低于Claude-2 Haiku。

例如,它可以基于DNA图像分析图像以解释DNA的结构(我认为这种能力非常适合学*新知识):

它还可以基于手绘涂鸦的Web设计草案推理生成HTML代码:

您可以通过拍照并让您回答多项选择数学问题来轻松完成考试论文:

至于如何使用PixTral 12B,如果您的硬件性能足够,您当然可以自己部署;但是Mistral的开发人员关系负责人Sophia Yang还表示,将来将通过Mistral的Le Chat和La平台提供该模型。

Mistral的愿景:使AI有用且有用

他们认为,使AI有用的最重要的事情实际上是系统问题。

Mistral的第一个多模式模型Pixtral 12B!或只是释放24GB磁性链接

但是对于不了解相关技术的普通用户,该系统似乎非常复杂。 Mistral想要做的是简化用户的使用过程并降低用户的使用成本。他们希望将所有复杂的技术零件集成到LA Platforme中,以便用户可以以简单的配置来享受AI带来的便利和效率。

此外,为了使AI具有解决复杂问题的能力,有必要使用用户互动来连续培训AI模型。同时,还必须将新软件不断地集成到AI工具箱中以提高其功能。

目前,Mistral的模型矩阵已经包含各种免费模型,用于一般和科学研究任务。

此外,该公司开发了用于编程任务的Codestral模型,该模型支持80多种编程语言,并且具有出色的性能。但是,应该指出的是,尽管Mistral允许研究人员免费将Codestral用于研究和测试目的,但如果他们想将其投入商业应用程序,但他们需要从他们那里购买商业许可——,这是该公司少数有利可图的项目之一。

米斯特拉尔(Mistral)于今年6月获得了6.4亿美元的投资,其估值为60亿美元,不久之后,该公司发布了公司的旗舰车型Mismtral大2号。

Mistral大2的参数数量为123B,支持多语言和功能调用,并且具有强大的推理和代码功能。尽管总体性能不如当前最佳GPT-4O和Claude-3.5十四行诗好,但它超过了具有405B参数的Llama 3.1。同样,Mistral flow 2也可以免费提供非商业用途。

Mistral团队绝对是AI模型开发领域的清晰流。如今,在AI领域通常关注营销和宣传的地方,Mistral的Twitter有100,000名关注者,但没有跟随任何人。它只有10条推文几乎所有推文都发布了新型号,其首席执行官Arthur Mensch的个人帐户也不活跃。

Mistral AI成立于2023年5月,是法国人工智能创业公司,也是欧洲大型模型开源场的少数明星团队之一。一个有趣的小知识是,由于公司来自法国,le聊天实际上是“猫”,这就是为什么其徽标看起来像猫的原因。

Mistral AI在2023年6月获得了创纪录的1.18亿美元种子回合(占欧洲历史上最大的种子回合)。当然,几天前,由Ilya Sutskever创立的Safe Supertelligence Inc.打破了这一记录。

参考链接:

用户评论

她的风骚姿势我学不来

太牛了!我一直期待着多模态模型的发展,Mistral这个团队真是厉害。一个强大的12B参数模型,而且还能下载24GB的磁力链路?这下终于可以自己体验一下啦!

    有10位网友表示赞同!

焚心劫

这速度也太快了吧!Pixtral 12B刚发布就放出磁力链接了?这么敢做其他团队都没有,真心佩服Mistral的魄力。不过还是得等测试一下效果再说。

    有17位网友表示赞同!

漫长の人生

多模态模型一直是我的心头好,可惜很多都是封闭开发的,这次Mistral开源真太棒了!12B参数已经非常大了,期待Pixtral能够带来更优秀的图像和文本生成能力!

    有19位网友表示赞同!

你很爱吃凉皮

磁力链接这个形式我有些不太*惯,是不是可以提供更加方便稳定的下载方式?毕竟这种大模型文件确实挺重的,还是希望能体验一下官方的Web UI界面.

    有16位网友表示赞同!

何必锁我心

12B参数看起来很大,但是我更看重性能表现。说实在的,很多高参数模型并没有实际实质的效果提升。希望Mistral能够证明Pixtral 能够提供更优秀的应用结果!

    有17位网友表示赞同!

无寒

这个磁力链接下载速度也太慢了吧?感觉下载几个小时都没办法完成。这对于用户体验来说真的不太友好,建议Mistral官方提供更加高效的下载方式,例如云平台下载。

    有20位网友表示赞同!

话扎心

我一直觉得开源不仅仅是代码的公开,更重要的是社区的支持和贡献。希望Pixtral能够建立一个活跃的开源社区,让开发者们一起发展这个强大的多模态模型!

    有15位网友表示赞同!

容纳我ii

我对Mistral这个团队持保留态度,他们的博客文章总是感觉过于宣传,缺乏实际案例的支撑。这次Pixtral 12B也一样,就等大家测试后再看看最终效果吧。

    有15位网友表示赞同!

剑已封鞘

这么大的模型参数确实会带来强大的计算需求,希望Mistral能够兼顾资源的利用效率和模型性能提升。毕竟环境保护也是很重要的一件事!

    有10位网友表示赞同!

予之欢颜

期待Pixtral能够在图像识别、文本生成等领域取得突破性的进展。多模态模型的潜力巨大,我相信它将会改变我们未来的生活。

    有20位网友表示赞同!

空谷幽兰

12B参数确实很大了,但是我对这种“大模型”的趋势感到担忧。有时候过大的模型带来的效果提升并不像宣传的那样明显。我觉得更重要的是模型的应用场景和实质的效果!

    有15位网友表示赞同!

素衣青丝

感觉Mistral这个团队一直跟风潮流抢先发布,没有真正深入研究。他们只是将最新的架构套用到项目上,缺乏原创性。就拿Pixtral 12B来说,参数这么大真的有必要吗?多看看其他团队的成果再做决定吧。

    有16位网友表示赞同!

留我一人

对于初学者来说,下载解开这个巨大的24GB文件可能比较困难。希望Mistral能够提供更加友好的教程和文档,让更多人能够上手测试Pixtral 12B!

    有14位网友表示赞同!

陌颜

我曾经使用过一些开源的多模态模型,感觉效果还不如官方推出的产品稳定可靠。希望Pixtral能够在实际应用场景中证明自己的实力,成为一个真正强大的工具!

    有6位网友表示赞同!

颓废人士

多模态模型的发展确实让人兴奋,它将会为我们带来很多新奇的体验。只是我希望Mistral能够更专注于研究和开发,而不是只注重发布数量和规模。

    有20位网友表示赞同!

命运不堪浮华

我对Pixtral 12B的期待很高,希望它能够突破文本和图像之间的界限,创造出更多令人惊叹的多模态内容!

    有5位网友表示赞同!

陌潇潇

这个磁力链接下载有点麻烦,感觉不像官方提供的资源。我更希望Mistral能够提供直接下载的链接,方便用户使用。

    有19位网友表示赞同!

浮世繁华

多模态模型的发展速度非常快,我相信Pixtral 12B仅仅是个起点。未来一定会出现更加强大的模型和更酷炫的应用!

    有17位网友表示赞同!

致命伤

这个项目太棒了!我迫不及待想尝试一下Pixtral 12B! 这将是一个开创性的多模态模型,我希望它能被广泛应用于各个领域!

    有12位网友表示赞同!

标题:Mistral的第一个多模式模型Pixtral 12B!或只是释放24GB磁性链接
链接:https://www.yaowan8090.com/news/xydt/48886.html
版权:文章转载自网络,如有侵权,请联系删除!
资讯推荐
更多
阴阳师4月22日更新内容:帝释天上线技能调整,红莲华冕活动来袭

阴阳师4月22日更新内容:帝释天上线技能调整,红莲华冕活动来袭[多图],阴阳师4月22日更新的内容有哪些?版本更新

2025-07-29
四川电视台经济频道如何培养孩子的学习习惯与方法直播在哪看?直播视频回放地址

四川电视台经济频道如何培养孩子的学习习惯与方法直播在哪看?直播视频回放地址[多图],2021四川电视台经济频

2025-07-29
湖北电视台生活频道如何培养孩子的学习兴趣直播回放在哪看?直播视频回放地址入口

湖北电视台生活频道如何培养孩子的学习兴趣直播回放在哪看?直播视频回放地址入口[多图],湖北电视台生活频道

2025-07-29
小森生活金币不够用怎么办?金币没了不够用解决方法

小森生活金币不够用怎么办?金币没了不够用解决方法[多图],小森生活金币突然就不够用的情况很多人都有,金币没

2025-07-29