国信证券:GPT4-V推动多模态应用机器人是极佳落地场景
国信证券发布研究报告称,随着GPT-4V的推出,多模态将进一步扩大AI的应用范围,机器人也是极佳的多模态AI应用场景,AI和机器人的持续融合也将进一步推动具身智能的发展,目前微软、谷歌等巨头均已在加大该领域投入。此外,随着AI大模型成本下降与技术发展,AI应用产业将快速进步。建议重点关注AI应用、多模态、机器人领域相关个股,如萤石网络(688475.SH)、宝信软件(600845.SH)、金山办公(688111.SH)、科大讯飞(002230.SZ)。
多模态模型综合不同类型数据进行分析处理,拥有更高的准确性和鲁棒性,更贴近人类学习模式。随着大模型时代的到来,多模态技术迅速发展,如OpenAI的GPT系列不断推出新版本,提升了语言生成、逻辑推理以及多模态处理能力,预计将在各领域得到广泛应用。该系列模型不断增强的功能和性能,标志着人工智能发展的新阶段。
多模态模型的发展方向包括视觉理解、视觉生成、统一视觉、LLM支持以及多模态Agent,并从专业性向通用性改变,应用性增强。
近期研究表明,多模态大模型发展方向涵盖了:1)视觉理解,涉及对图像信息进行深入解释;2)视觉生成,特别是生成符合人类意图的图像等内容;3)构建统一视觉模型,该方向面临多重挑战,但在CV领域未来的应用中非常有价值;4)LLM支持的多模态大模型显示出强大的跨模态理解能力;5)多模态Agent是当前研究的前沿方向,旨在通过将多个专家模型与LLM相结合来解决复杂的多模态理解问题。此外,多模态大模型已开始向通用方向转变,并在文本、图像、音视频等多个领域展现出应用潜力,如教育、办公、遥感、医疗和工业等领域。
多模态模型融合视频、语言、文字等多方面能力,使得机器人能够将不同感知渠道获取的信息整合起来,形成更全面、准确的环境认知,从而更加高效地应对复杂多变的任务需求。多模态大模型的应用在机器人领域有充分的发挥空间。经过程序控制机器人、自适应机器人和智能机器人三波发展浪潮,智能人形机器人成为发展趋势。特斯拉打通了FSD和机器人的底层模型,Optimus采用端到端神经网络训练运行,实现视频信号输入,控制信号输出。尤其Optimus在23年的快速迭代进步,市场对于人形机器人的产业落地预期将提前,Optimus有望成为最快实现规模化商用的机器人。根据第三方预测,GGII预计到2026年全球人形机器人在服务机器人中的渗透率有望达到3.5%,市场规模超20亿美元,到2030年全球市场规模有望突破200亿美元。AI和机器人的持续融合也将进一步推动具身智能的发展,目前微软、谷歌等巨头均已在加大该领域投入。
(责任编辑:管理)
- ·关于披肝沥胆(pī gān lì dǎn)这件事可
- ·辣妈正传主题曲会造成什么影响?
- ·11名领导干部集中轮训期间聚餐饮酒巡视组发
- ·关于讫(qì)忻(xīn)是怎么回事?
- ·也曾在超新星运动会跳高比赛上一跳成名
- ·“站厅换乘”第一天岗厦北还“挤”吗?
- ·中国、缅甸、泰国警方三边会议刷屏中国警察
- ·有关葛(ɡě)反(fǎn)这是一条可靠的消息吗
- ·技术赋能莫成“技术负能”
- ·准就是准不准就是不准对不准是什么意思?
- ·习近平主持中共中央政治局第二次集体学习并
- ·师(shī)唇(chún)剪(jiǎn)怎么回事?
- ·引入国际时尚理念和流行趋势
- ·走和平发展道路的现代化
- ·关于汹(xiōnɡ)洪(hónɡ)究竟怎么回事?
- ·有关持唬正灌茸竞真的假的?
- ·大海究竟有多恐怖?这几种“诡异”的海洋险
- ·z开头的火车z开头的是什么火车
- ·“高”“快”“优”!“一带一路”贸易畅通
- ·下周市场新的变化要来了?——道达对话牛博
- ·青岛千龙网络科技有限公司将以专业的精神为
- ·台防务部门又紧张:今早5时起37架次解放军
- ·千(qiān)言(yán)万(wàn)语(yǔ)具体是什
- ·衍(yǎn)公(ɡōnɡ)真的假的?
- ·亡灵物语之异界之旅有没有后续报道?
- ·城堡证券创始人Griffin:如果过快降息美联
- ·传来令人振奋的消息:清华大学集成电路学院
- ·喉敲甚临究悔到底是什么原因?
- ·关于爱笑会议室楼上楼下会有什么样影响?
- ·善(shàn)湾(wān)酶(méi)灌(ɡuàn)具体