AI大时代,短短几个月,大模型就狂风席卷。
据不完全统计,目前国内号称投入大模型的厂商有30多家之多,市场拥堵。不同行业、不同体量、各种规模、不同层次的大模型争流而上,各种版本让人眼花缭乱。对于企业级市场而言,大模型距离落地是“一步之遥”,或者是“万水千山?” 面对细分复杂的场景,如何在经济、可信、高效的基准上,与客户一起共创大模型,让数字化转型再上新台阶?
基于多年的NLP技术积累与行业实践,面向客户洞察和需求,追一科技全面拥抱大模型技术,自主研发领域大模型“博文Bowen”,现有AI数字员工产品矩阵也将陆续整合大模型技术和能力,进化升级,提升效能,更好助力金融、政务等领域客户数字化、智能化升级。同时,追一科技也将与头部客户和合作伙伴一起,共创合作、打磨场景应用,加快推进大模型成熟落地。
AI大模型落地的三大挑战
1、安全
不管什么样的技术创新应用,安全都是一道红线。从宏观层面“安全发展”到企业自身数据安全、用户隐私保护、合规信创的角度,都需要考量安全挑战。ChatGPT火爆全球,出于数据跨境监管要求和国家层面数据主权安全风险考虑,政务、金融等行业不适合在业务中直接接入ChatGPT模型。从技术自主与信息安全的双重角度来看,国产大模型独立自主发展均具有必要性。
2、性价比
大模型的落地和商业应用,需要考虑成本的经济性。庞大的数据、算力和研发投入成本,而场景、收益的相对不确定性,让大模型至少在短期阶段,还面临落地挑战。“大力出奇迹”、“暴力美学”在推高效果同时,效率也是必须关注的问题。特别是企业级市场,如何以更低成本和更高效方式,研发可精准解决垂直领域任务模型,将是一个新课题。
3、专业、可控
通过对话交互形式,ChatGPT大模型表现了极强的出圈、跨界、多任务能力。“一本正经地胡说八道”,放在一些消费级和通用场景无伤大雅,但在专业和垂直领域,如何确保“不翻车”?保证内容的确定性、专业化,真正解决用户问题?从信息“高速公路”到终端家门口,还需要弯弯绕绕一段路。
深入领域应用实践,追一科技大模型博文Bowen助力行业智能化
在多年的企业数字化服务实践基础上,追一科技紧贴安全、合规、信创等新时代智能化要求,推进创新AI技术能力应用,并不断探索智能化应用的新范式,构建以垂直领域大模型“博文Bowen”为核心的大模型平台能力,赋能人机对话交互和协同、分析等场景应用。在行业大模型解决方案上,锚定金融、政务领域,整合大模型能力引入到当前成熟的技术栈,提升产品效能,使客户实现“降本增效”,并赋能更多智能化应用场景。
相比通用大模型,追一自研领域大模型将拥有更垂直适用的任务能力,可适配具体行业业务场景中的任务,如金融、政务领域中的咨询服务、文案生成、专家决策等;在知识能力上,更有领域内纵深优势,且保证即时性。在应用方式上,支持私有化部署,对于金融、运营商等垂直行业的特定场景,保证数据安全的同时,还能更灵活地去应对业务场景。
咨询服务
为客户提供高质量的精准服务,优化流程性任务的体验,可根据客户交互信息、历史数据做出快速而准确的建议。例如,在金融行业的理财咨询中,根据历史数据与客户风险偏好,为客户提供金融产品或定制化个人理财建议。政务场景中,各地相关政策具有多样性,基于大模型能力,可根据与居民/企业的交流内容,快速判定并精准适配最新政策,实现高效便民服务。
辅助生成
可根据公开市场信息及实时数据,辅助相关文案的生成。在金融领域中,可根据公开市场信息及实时数据生成时效性报告(如财经新闻、金融市场报告)与分析类报告(投研分析报告)等。在政务领域中,生成如指挥类、通联类、公布类、记录类、报请类等规范性公文以及如工作报告、简报、书信、启事类等非规范性事务公文。
专家系统
根据相关政策法规,以及与用户对话信息做出专业、准确的判断与决策。例如,在保险理赔中,通过与客户的对话快速识别问题,了解损失详细情况,更快处理理赔请求。在信贷投保审批过程中,协助银行分析借款人的信用状况和还款能力,协助保险公司分析投保人资格和匹配险种。在舆情监控方面,对相关舆情数据自动化处理和分析,为政策制定提供科学依据;在警务处理上,可对报警信息进行快速识别、判断,提高决策与出警效率。
而随着大模型的落地,除了现有AI机器人场景的升级提效外,未来将有更多场景解锁。
深耕NLP,技术攻关极致创新
大模型的创新,离不开坚实的AI技术底座。
追一科技作为深耕NLP多年的佼佼者,在发展中一直紧密追踪学术前沿,保持预判并率先布局前沿技术。在自然语言预训练模型方面,先后研发了Simbert、T5-Pegasus中文模型、RoFormerV2等创新模型。自研Roformer模型中的旋转位置编码RoPE技术被Google、Meta、腾讯等大厂大模型采用,成为大模型的标配位置编码方式之一。
团队还致力于通过工程化能力,实现资源、效率、效果平衡与最优解,挖掘模型参数与训练数据量平衡点同时保证模型涌现能力,为大语言模型研发提供保障。自研bert4keras框架,适配数十个中文开源模型,在中文NLP圈应用。自研Tiger优化器,在训练阶段将显存优化到极致,降低训练成本。
在领域大模型的构建中,追一科技研发团队采用生成式预训练+强化学习算法,将所有任务统一转换为文本生成任务,通过采用「领域数据」预训练+Prompt 数据微调和基于RLEF「领域专家反馈」强化学习(Reinforcement Learning from Expert Feedback),搭建垂直领域大模型。
同时,以垂直领域大模型作为核心,以其它专有模型辅助,共同支持需求,并通过知识外引与注入,如搜索、推荐、查询等知识工具,结合知识整合模块,整合各类垂类知识,形成一套安全可控且高度适配下游业务逻辑的完整AI系统,为客户提供高效、高质的解决方案。