编辑说明:Kumo AI曾是VB Transform年度创新展示活动的决赛选手之一,并于周三在VB Transform主舞台展示了RFM。
生成式人工智能的兴起,使我们拥有了能够撰写、总结和处理大量文本及其他类型数据的强大语言模型。然而,在涉及高价值预测任务(如从结构化关系数据中预测客户流失或识别欺诈行为)时,企业仍受限于传统机器学习的框架。
斯坦福大学教授、Kumo AI 创始人之一 Jure Leskovec 认为,这正是当前缺失的关键环节。他公司研发的工具——关系基础模型(RFM),是一种新型的预训练人工智能,将大型语言模型(LLMs)的“零样本”能力引入结构化数据库。
“这是关于对未知事物进行预测,关于尚未发生的事情的预测,” Leskovec 对 VentureBeat 说道。“我认为这是一种根本性的新能力,而目前我们所理解的生成式人工智能(gen AI)还尚未具备这一能力。”
为何预测型机器学习是一种‘30 年前的技术’
尽管大语言模型(LLMs)和 retrieval-augmented generation(RAG)系统能够回答已有知识相关的问题,但它们本质上是回顾性的。它们通过检索和推理已有的信息来运作。而在预测型业务任务方面,企业依然依赖传统的机器学习方法。
例如,要构建一个预测客户流失的模型,企业通常需要组建一支数据科学家团队,投入大量时间进行“特征工程”,即手动从数据中提取出可用于预测的信号。这一过程涉及复杂的数据处理,需将不同表格中的信息(如客户的购买历史和网站点击记录)进行整合,构建出一个庞大的训练数据集。
“如果你想做机器学习(ML),很抱歉,你仍然被困在过去。” Leskovec 说道。高昂且耗时的成本成为大多数组织灵活运用数据的一大障碍。
Kumo 如何将 Transformer 模型应用于数据库
Kumo的方法,“关联深度学习”,通过两项关键洞察跳过了人工处理流程。首先,它能够自动将任意关系型数据库转换为一个相互连接的图结构。例如,若数据库中包含一个“users”表用于记录客户信息,还有一个“orders”表用于记录客户的购买记录,那么“users”表中的每一行对应一个用户节点,“orders”表中的每一行则对应一个订单节点,依此类推。这些节点随后会依据数据库中已有的关系(如外键)自动建立连接,从而形成完整的数据集映射,无需人工干预。
关联深度学习 来源:Kumo AI
第二,Kumo将Transformer架构——大语言模型的核心技术——扩展至图表示,从而直接从图中学习。Transformer通过“注意力机制”衡量不同标记之间的相对重要性,擅长处理标记序列。
Kumo的RFM将相同的注意力机制应用于图结构,使其能够同时学习多个表之间的复杂模式与关系。Leskovec将这一突破比作计算机视觉的发展。在2000年代初期,机器学习工程师需要手动设计边缘和形状等特征来识别物体。但像卷积神经网络(CNN)这样的新架构可以直接输入原始像素,并自动学习相关特征。
同样,RFM 接收原始数据库表格,使网络自主识别最具预测性的信号,无需人工干预。
最终生成的是一个预训练的基础模型,能够在新的数据库上即时完成预测任务,这种能力被称为“零样本”。在演示中,Leskovec 展示了用户如何通过一个简单的查询,预测某个特定客户是否将在未来30天内下单。系统在几秒钟内返回了概率评分,并提供了导致该结论的数据点解释,例如用户的近期活跃行为或缺乏活跃行为。该模型并未在提供的数据库上进行训练,而是通过 in-context learning 在实时中进行适应。
“我们有一个预训练模型,您只需指向您的数据,它将在200毫秒内提供精准的预测,” Leskovec 说道。他补充道,该模型的准确性“可以媲美数据科学家数周的工作成果”。
该界面旨在让数据分析师也能轻松上手,而不仅限于机器学习专家,从而推动预测分析技术的普及与便捷使用。
Powering the agentic future
这项技术对AI代理的发展具有重要意义。为了让代理在企业内部执行有价值的任务,它不仅需要处理语言,更需基于企业的私有数据进行智能决策。RFM可作为这些代理的预测引擎。例如,一个客户服务代理可以通过查询RFM,判断客户流失的可能性或其未来潜在价值,再借助大语言模型(LLM)定制对话内容与解决方案。
“如果我们相信一个以代理为中心的未来,那么代理将需要基于私有数据做出决策。而这正是代理发挥作用的方式,” Leskovec解释道。
Kumo的工作预示着企业AI发展的新方向:未来将形成两个互补的领域,一方面由大语言模型(LLMs)处理非结构化文本中的回顾性知识,另一方面则由关联基础模型(RFMs)专注于结构化数据的预测任务。通过消除传统特征工程的瓶颈,RFM有望将强大的机器学习能力带给更多企业,显著缩短从数据到决策的周期,降低相关的时间与成本。
公司已发布RFM的公共演示版本,并计划在未来几周推出一个支持用户接入自身数据的版本。对于对准确性有更高要求的组织,Kumo还将提供微调服务,进一步提升模型在私有数据集上的表现。
来源:RAG 原文地址:https://venturebeat.com/ai/kumos-relational-foundation-model-predicts-the-future-your-llm-cant-see/
评论 (0)
还没有评论,来说两句吧!