周三(6日),来自中国的创业公司Monica正式对外发布通用型AI Agent产品Manus,据报道,Manus性能优于AI巨头OpenAI的同层次大模型。3月6日,A股三大指数集体高开高走,AI应用方向集体爆发,酷特智能等多股涨停。当前,大模型行业已呈现蓬勃发展态势,Manus的横空出世,将再一次引爆科技树,相关已布局多模态大模型的A股上市公司将直接受益,如A股“字库第一股”汉仪股份(301270),通过多模态大模型的应用研究,探索各种大模型在文字、图像、视频等设计领域的应用创新落地。
据悉,这是全球首款真正意义上的通用AI Agent,从官网展示的案例可以看到,它能够独立思考、规划并执行复杂任务,直接交付完整成果。官方宣称,Manus不仅仅是一个只会聊天的对话式AI工具,而是一个真正的自主智能体(Agent)。从介绍来看,相较于目前的大模型产品,作为通用型Agent,Manus定位于一位性能强大的通用型助手,对于用户不仅仅是提供想法,而是能将想法付诸实践,真正解决问题。从发布的视频演示来看,Manus在接到用户指令后可以直接操作电脑完成一系列报告撰写、表格制作等工作,并在最后导出符合用户需求的产品。并且,不同于此前各类功能相对简单的人工智能助手,Manus拥有超强学习能力和适应性的“数字大脑”,不再局限于单一任务,而是能够理解复杂指令、自主学习、跨领域协同,真正像人一样思考和行动。
业内人士分析认为,结合官方介绍,Manus作为一个真正的自主智能体(Agent),不需要去通过语言去引导就能实现客户需求,那么它每个解决问题的细节转换都离不开多模态大模型。
据了解,自2024年5月14日OpenAI发布多模态AI大模型GPT-4o以来,多模态大模型兴起,成为多模态人工智能发展的新方向。多模态大模型建立在大语言模型LLM和大型视觉模型LVM以及其他模态模型(如语音模型)的基础上,借助大模型的强大计算能力,实现更加复杂和智能任务的处理,例如总结图片/视频内容,根据文字描述生成图片/视频等。目前,国内已有多家上市公司布局多模态大模型。
如A股“字库第一股”汉仪股份,通过自研和战略合作,布局人工智能领域的创新产品,尤其是多模态大模型的应用研究方面,探索其在文字、图像、视频等设计领域的应用创新落地,并取得了突破性进展。汉仪股份此前接受机构调研时表示,结合文本、图像和视频的等多模态内容生成技术,公司布局开展了营销海报生成、虚拟换装、图生视频、视频混剪等方面的产品规划和研发工作,例如针对服饰类电商客户,研发AI模特商拍和商品图合成技术,替代传统拍摄方式,为品牌营销图智能换脸、智能合成商品背景图等功能,降低客户商品拍摄与处理成本,提升商品上架速度和展示效果;针对视频电商客户,研发AI视频剪辑解决方案,替代传统人力剪辑方式,可大大降低剪辑处理的成本,提升营销内容生产和投放效率,上述应用已在公司kreatr 工具平台上线,并已和外部企业展开商业合作。
就如接入DeepSeek一样,各大互联网厂商未来也会快速接入Manus,在输出用户需求的环节就可能涉及如文字、图片方面的版权问题。目前,汉仪股份在字库产品的互联授权领域占据领先地位。在互联网授权领域,公司主要合作伙伴为腾讯QQ、华为、OPPO、VIVO等互联网厂商和手机厂商,并与上述主要客户保持稳定合作关系,来自华为、OPPO等智能手机平台的收入及占比呈上升趋势。未来,有望与各大主要合作伙伴在多模态大模型的应用上展开全面合作,抢占市场先机。
分析人士认为,大模型行业已呈现蓬勃发展态势,面对这一蓝海市场,A股公司纷纷加大投入,争相涌入大模型行业。多模态大模型能够处理多种模态的数据,实现更加复杂的智能任务,抓住应用需求则是相关企业能够实现突围的关键。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。