很抱歉,当前没有启用javascript,网站无法正常访问。请开启以便继续访问。科创板话题:多模态模型
多模态模型
话题简介
多模态通常包含两个或者两个以上的模态形式,使用多模态数据能够使得事物呈现更加立体、全面,多模态研究成为当前研究重要方面,在情感分析、机器翻译、自然语言处理 和生物医药前沿方向取得重大突破。
①生数科技在两个月内有如此提升已经是算法和工程能力上的突破,但在同等性能表现下追平Sora的1分钟时长,还有较长的一段路要走。
②目前,Vidu对外公布的时长上限是16秒,Sora最大时长则是1分钟。
04月28日 16:40 来自 界面新闻 伍洋宇1.88W+
财联社4月11日电,多模态AI概念持续走强,三六零午后涨停,昆仑万维、值得买、引力传媒、华策影视等涨幅靠前。消息面上,近日,AIwatch.ai发布“全球AI产品增速黑马榜”,三六零两款AI产品进入前十,其中360AI搜索居榜首,3月访问量环比增加1677%。360苏打办公同时上榜,数据显示其3月访问量超WPS,据了解“苏打办公”将集成更多AI爆款应用,升级为360AI办公工具集。
04月11日 13:06 7.89W+
财联社4月10日电,大模型的应用需要深入各行各业,解决实际问题。要拓宽其应用场景,加强大模型技术与产业的深度融合,推动产学研合作,解决技术合规性、安全性、数据质量等问题,助力大模型走向广阔市场空间。展望未来,期待看到更多具有开源精神的项目和创新生态社区涌现,推动技术的共享和发展,成为技术与产业结合的桥梁和纽带。 (经济日报)
04月10日 06:01 来自 经济日报7.65W+
《科创板日报》2日讯,2日获悉,在复旦大学自然语言处理实验室(FudanNLP)师生的努力下,基于多模态大模型“复旦·眸思”(MouSi)为视障者量身打造的“听见世界”APP上线,将成为视障人士的生活助手与智能管家。2023年上半年,复旦大学自然语言处理实验室发布了开发MOSS对话式大型语言模型,被称为中国版的GPT,仅用半年时间多模态模型“眸思”问世。据介绍,“眸思”和基于文本的MOSS不同,它能够理解并识别图片内容,致力于成为视障者的一双“眸”。
03月02日 18:47 7.82W+
①在AI视频生成领域,要让视频人物和声音完美同步,仍是一个巨大的挑战;
②EMO不仅可以生成任意时长的说话视频,还能生成人像整个头部都发生丰富变化的说话视频,表情、五官、姿势都会产生非常自然的变化;
③从技术方面来看,视频生成工具的底层模型及技术仍在优化,有望诞生更多后起之秀。
02月29日 17:27 来自 科创板日报 宋子乔2.12W+
财联社2月29日电,国新文化涨停,开普云、宣亚国际、因赛集团涨超5%,天娱数科、竞业达、汉王科技等跟涨。消息面上,字节跳动正在AI大模型领域秘密研发多个产品,其中包括多模态数字人产品以及AI生图、AI生视频产品等。
02月29日 09:40 7.71W+
①《千秋诗颂》由“央视听媒体大模型”制作,美术设计、动效生成和后期成片等各环节均由AI辅助制作;
②同等预算条件下,按照传统动画制作流程计算,《千秋诗颂》至少需要8个月时间,依托大模型后,制作周期缩短至4个月;
③对于古诗词的理解,不能单凭AI技术,打造优质中文语料库至关重要。
02月26日 20:30 来自 科创板日报 宋子乔1.46W+
①在大规模训练时,Sora已可以模拟数字世界,渲染出与《我的世界》游戏极其相似的HUD、高保真度渲染世界及游戏动态,还能控制玩家角色。
②英伟达高级研究科学家Jim Fan猜测,Sora不会明确调用UE5(虚幻引擎5),但有可能将UE5生成的文本、视频当做合成数据添加到训练集中。
02月19日 21:23 来自 科创板日报 郑远方2.23W+
①OpenAI发布了首个文生视频模型Sora,可以用文字指令生成长达1分钟的高清视频。
②不少业内分析指出,这将对于广告业、电影预告片、短视频行业带来巨大的颠覆。也有从业者保持冷静:短期内的颠覆速度不一定那么快,更多地是借助新技术,激发更多人的创作力
02月17日 08:59 来自 财联社记者 黄心怡2.48W+
①Open AI对外公布文生视频模型Sora,其建立在过去对DALL-E和GPT模型的研究基础之上;
②Sora能够从文本说明中生成长达60秒的视频,并能够提供具有多个角色,特定类型的动作和详细的背景细节的场景;
③Sora还能在一个生成的视频中创建多个镜头。
02月16日 13:45 来自 财联社 唐叶天2.95W+
财联社2月6日电,昆仑万维涨超10%,云从科技、汤姆猫、软通动力涨超5%,三六零、视觉中国、中文在线、拓尔思等跟涨。消息面上,据外媒报道,谷歌表示,Gemini Pro是谷歌最大的人工智能(AI)模型之一,作为巴德(Bard)的升级版,现已向欧洲用户开放。通过Gemini,谷歌希望能与OpenAI的热门聊天机器人ChatGPT进行竞争。
02月06日 10:44 6.97W+
财联社1月23日电,昆仑万维涨近10%,科大讯飞、万兴科技涨超5%,三六零、拓尔思、云从科技、汤姆猫等跟涨。华金证券研报表示,24年初,荣耀和三星开启了新一年端侧AI竞赛,AIGC下沉端侧或将成为AI本年热点之一。端侧AI的蓬勃发展在硬件和生态端给予有力支撑,toC端内容创作门槛或将进一步降低,对硬件和算力强需求的游戏等产业或将迎来有力支撑。
01月23日 13:17 8.03W+
财联社12月26日电,云从科技跌超7%,昆仑万维、软通动力、天娱数科、新华网、宣亚国际等跌超5%。
12月26日 13:33 7W+
①全国首个官方“大模型标准符合性测试”结果公布,百度、腾讯、三六零、阿里云旗下大模型首批通过测试。
②《人工智能模型即服务(MaaS)参考架构》标准文件、《人工智能开源模型服务平台技术要求》已启动编制。
③券商认为,我国大模型的标准化正稳步推进,未来AI发展速度有望持续提升。
12月25日 12:01 来自 科创板日报 郑远方2.34W+
①从零开始训练而成,整个开发周期长达九个月;
②在理解力以及光影、构图、材质、色彩等细节方面,V6远胜上一代产品;
③Midjourney平均每3个月更新一次,其未来的技术更新方向包括生成3D及视频。
12月23日 10:07 来自 科创板日报 3.17W+
财联社12月15日电,网达软件跌超8%,云鼎科技、汉王科技跌超5%,当虹科技、昆仑万维、万兴科技、思特奇等跟跌。
12月15日 09:55 8.08W+
①在多模态这条路上,谷歌已全面出击;
②谷歌有意强调了Imagen 2的营销用途——可用于logo生成、制作商品广告页;
③目前并没有向所有人开放,仅供许可名单上的Vertex AI客户使用。
12月14日 15:52 来自 科创板日报 宋子乔2.09W+
财联社12月14日电,多模态概念反复走强,苏州科达6连板,引力传媒10天6板,云鼎科技大涨8%,力盛体育、广联达、平治信息等跟涨。消息面上,当地时间周三,美国科技巨头谷歌宣布,为其云客户提供一系列升级后的人工智能工具,向竞争对手OpenAI的大模型GPT-4发出挑战。谷歌云客户可以使用Gemini创建人工智能聊天机器人、易于查询的数据库和营销演示等应用程序。该公司还强调,Gemini Pro在推出时将免费提供给云客户,但会施加一些限制措施。
12月14日 09:41 6.92W+
财联社12月13日电,汉王科技2连板,苏州科达5连板,云鼎科技、当虹科技涨超5%,拓尔思、因赛集团等跟涨。消息面上,据媒体报道,谷歌的一个团队提出了使用人工智能技术,通过移动手机数据(如照片和搜索记录)创建用户生活的“鸟瞰”视图的构想。该构想的目标是利用类似于Gemini的大型语言模型(LLM),摄取搜索结果,识别用户照片中的模式,创建聊天机器人,并“回答以前无法回答的问题”,“Project Ellmann的目标是成为“用户的生活故事的讲述者”。
12月13日 10:20 7.05W+
财联社12月11日电,随着Gen-2、Pika1.0、Gemini等多模态模型的快速涌现,全球大模型多模态化趋势日益显著。推动AI多模态产品应用场景落地的引力传媒盘中触及7天5板,多模态大模型已初具雏形的苏州科达收盘三连板,可利用多模态AI对真人建模制作虚拟数字人的国脉文化三天两板,自研InsightGPT属于营销行业多模态垂直模型的因赛集团大涨14.78%,中文逍遥大模型可展现出多模态能力的中文在线大涨11.41%。据财联社不完全统计,云鼎科技(收盘涨停)、芒果超媒、佳都科技、二六三在互动易最新回应多模态业务。另外,科创信息、吉大正元最新回应无多模态业务。
12月11日 19:44 7.06W+
加载更多