多模态模型
话题简介
多模态通常包含两个或者两个以上的模态形式,使用多模态数据能够使得事物呈现更加立体、全面,多模态研究成为当前研究重要方面,在情感分析、机器翻译、自然语言处理 和生物医药前沿方向取得重大突破。

财联社4月29日电,腾讯对其混元大模型研发体系进行了全面重组,主要围绕算力、算法和数据三大核心板块刷新团队部署,加码研发投入。此次调整后,腾讯成立了两个新的部门:大语言模型部和多模态模型部,分别负责探索大语言模型和多模态大模型的前沿技术,持续迭代基础模型,提升模型能力。同时进一步加强大模型数据能力和平台底座建设,其中数据平台部专注大模型数据全流程管理与建设,机器学习平台部则聚焦机器学习与大数据融合平台建设,为AI模型训练推理、大数据业务提供全面高效的PaaS平台底座,共同支撑腾讯混元大模型技术研发。 (界面新闻)
04月29日 19:53 来自 界面新闻阅 5.43W+
《科创板日报》24日讯,智谱宣布对旗下多款大模型产品进行价格调整, 其中,GLM-4-Plus降价90%,从50元/百万tokens降至5元/百万tokens(相当于每亿tokens 500元),较行业价格低92%。(记者 李明明)
04月24日 12:46 阅 5.58W+
《科创板日报》15日讯,今日,月之暗面 Kimi 与 Numina 团队合作开发的数学定理证明模型 Kimina-Prover 推出预览版。据介绍,该模型在数学定理证明基准测试 MiniF2F上取得了80.7%的成绩,超过此前最佳水平 (SOTA)模型10.6%,创下新高。
04月15日 09:48 阅 5.22W+
财联社4月12日电,OpenAI在其网站上表示,从4月30日起,GPT-4将被GPT-4o“完全替代”,但GPT-4将继续通过API提供使用。OpenAI称,“在面对面的评估中,它(4o)在写作、编码、STEM等方面持续超过GPT-4。”据美媒The Verge 10日报道,OpenAI下周将揭晓一系列新的AI模型,其中将包括GPT-4.1, 这将是4o多模态模型的改进版。OpenAI同时还将推出更小的GPT-4.1 mini和nano版本,以及o3“推理”模型和新的名为o4-mini的推理模型。
04月12日 21:46 阅 6.88W+
《科创板日报》10日讯,今日,月之暗面Kimi开源轻量级视觉语言模型Kimi-VL和Kimi-VL-Thinking,新模型采用MoE架构,支持128K上下文,激活仅约30亿参数;多模态推理能力在多个基准测试中,超过10倍大小的大模型。
04月10日 11:13 阅 5.4W+
《科创板日报》3日讯,《科创板日报》记者今日获悉,2025年将是国内大模型独角兽智谱的开源年,其很快会发布全新大模型(包括基座模型、推理模型、多模态模型、Agent等),并将其开源。(记者 李明明)
03月03日 09:01 阅 5.22W+
财联社2月26日电,当虹科技涨超10%,万兴科技、开普云、华策影视、因赛集团、虹软科技、中广天择、华扬联众等跟涨。消息面上,阿里巴巴于昨日晚间全面开源旗下视频生成模型万相2.1模型,视频生成、图像生成两大能力均获得提升。
02月26日 09:29 阅 5.21W+
财联社2月21日电,在2月21日开幕的全球开发者大会(GDC)上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括基于300亿参数、全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生视频等多个领域,是中国最大的AI模型社区。 (澎湃新闻)
02月21日 13:28 来自 澎湃新闻阅 6.39W+
财联社2月18日电,在百度财报后的电话会上,百度董事长李彦宏透露,文心大模型4.5将开源,4.5将是百度有史以来最强大的大模型。他表示,开源4.5系列的决策源自于对技术领先地位的信心,开源将进一步促进文心大模型的广泛应用,并在更多场景中扩大其影响力,“但我想强调的是,无论开源闭源,基础模型只有在大规模解决现实问题时,才具备真实价值”。未来,百度将加速推动文心大模型的性能升级与成本降低。
02月18日 21:13 阅 5.79W+
视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。不同于Sora 、DALL-E 、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型,即可认知世界。 目前,该项目代码与模型已开源。
02月10日 13:13 阅 5.85W+
《科创板日报》5日讯,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署。(记者 黄心怡)
02月05日 12:37 阅 6.2W+
《科创板日报》19日讯,在云栖大会期间,通义万相大模型发布文生视频能力。同时,通义千问新一代开源模型Qwen2.5发布,涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,总计上架100多个模型。(记者 黄心怡)
09月19日 14:10 阅 7.53W+
《科创板日报》6日讯,今日,在2024世界人工智能大会(WAIC)上,启明创投发布了2024《生成式AI》报告预告,其中对多模态模型作出预测:将出现图像和文本的统一连续表示,并且基于此的图文联合扩散模型将达到GPT—10级别能力;3年内视频生成将全面爆发,结合3D能力,可控多视频生成将对影视、动画、短片的生成模式带来变革。(记者 李明明)
07月06日 15:55 阅 9.13W+
财联社5月13日电,多模态AI概念震荡回升,中胤时尚、网达软件涨停,万兴科技、佳发教育、因赛集团、值得买等跟涨。消息面上,OpenAI在社交媒体X上宣布,将于5月13日上午10点(北京时间5月14日凌晨1点)在其官网上直播演示ChatGPT和GPT-4的更新。据硅谷科技媒体The Information报道,OpenAI正在开发具备音频和视觉理解能力的AI语音助手,最早可能会在5月13日的活动上预览。
05月13日 10:05 阅 7.52W+
财联社4月11日电,多模态AI概念持续走强,三六零午后涨停,昆仑万维、值得买、引力传媒、华策影视等涨幅靠前。消息面上,近日,AIwatch.ai发布“全球AI产品增速黑马榜”,三六零两款AI产品进入前十,其中360AI搜索居榜首,3月访问量环比增加1677%。360苏打办公同时上榜,数据显示其3月访问量超WPS,据了解“苏打办公”将集成更多AI爆款应用,升级为360AI办公工具集。
04月11日 13:06 阅 7.89W+
财联社4月10日电,大模型的应用需要深入各行各业,解决实际问题。要拓宽其应用场景,加强大模型技术与产业的深度融合,推动产学研合作,解决技术合规性、安全性、数据质量等问题,助力大模型走向广阔市场空间。展望未来,期待看到更多具有开源精神的项目和创新生态社区涌现,推动技术的共享和发展,成为技术与产业结合的桥梁和纽带。 (经济日报)
04月10日 06:01 来自 经济日报阅 7.65W+
