7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2024”)在上海拉开帷幕。7月6日,天娱数科子公司智境云创创始人、CEO王智武出席“语料筑基,智生时代”WAIC 2024语料主题论坛,并在圆桌对话环节发表演讲,探讨3D数据集对人工智能发展的重要性,分享了天娱数科在企业级AI应用领域的全新战略布局与实践。
王智武表示,相较常规的2D大模型,3D大模型在“理解真实世界”这个维度上,能提供更准确和全面的重构、计算与决策能力,拥有更强的泛化能力和涌现特性,已经成为下一代大模型科研的重点。但目前3D数据集,尤其是高质量3D数据集的匮乏,仍然是行业发展的痛点。
“天娱数科的定位是企业级AI应用开拓者,已经服务了上千家品牌客户,超过上万家中小型企业,沉淀了大量的行业数据。在这个基础上我们不断进行3D数据集的建构和积累,自主研发了国内首个3D智能元宇宙垂类模型——智者千问,并在元享数字魔盒、智伴魔镜、AI数字人、简AI app等多款软硬件产品上落地应用,为商旅文游、互联网、教育、党务政建等领域提供AI智能服务。”王智武介绍。
据了解,天娱数科拥有世界顶级的光场扫描Light Stage重光照采集设备、超400平米的动捕棚,并且结合其合作伙伴、专注3D视觉+AI的银牛微电子的手持3D扫描设备,构筑了一整套完善的3D硬件设施,能够快速、准确地获取大规模、高精度的3D数据,并通过MetaSurfing-元享智能云平台基于现实数据补全或生成全新的合成数据,在经过简单的加工之后即可补充到3D数据集中,形成良性循环。另外,公司还与外部高精度3D数据供应商合作,获取高质量的3D数据资源,补充和丰富自己的数据集。
目前,天娱数科已经积累了规模达到3200万Tokens的语料库和超过2000个超高精度样本数据,并从“采、存、管、研、用”五个方面,研发了包含数据采集、清洗、标注、脱敏、存储等功能在内的3D数据处理工具。
王智武表示:“3D大模型的发展大体上需要经过3个阶段,理解真实世界、重构真实世界、链接虚实世界。前两个阶段是让虚拟世界更接近真实,第三阶段是让物理世界更加智能。通过大规模、高精度的3D数据集训练,目前智者千问已经基本实现了前两个阶段。在未来的第三阶段,3D大模型与空间计算技术将破除物理世界与虚拟世界的间隔,实现多个产业生产制造的颠覆式变革。”