甲骨文正在为其热浪数据分析云服务(以前称为MySQL HeatWave)添加以人工智能为重点的新生成功能。
甲骨文HeatWave高级副总裁Nipun Agarwal说,新名称凸显了HeatWave如何提供的不仅仅是MySQL支持,还包括HeatWave Gen AI、HeatWave Lakehouse和HeatWave AutoML。
在2023年9月的年度CloudWorld会议上,甲骨文预览了当时MySQL HeatWave的一系列以人工智能为重点的生成更新。
这些更新包括由大型语言模型(LLM)驱动的界面,使企业用户能够以自然语言与服务的不同方面进行交互,新的Vector Store、Heatwave Chat和对HeatWave Lakehouse的AutoML支持。
甲骨文表示,其中一些更新以及附加功能已合并,在HeatWave内部形成了HeatWave Gen AI产品,并补充说,所有这些功能和功能现在通常无需额外费用即可使用。
数据库内LLM支持以降低成本
分析师表示,在数据库供应商中,甲骨文首次在数据库中增加了对LLM的支持。
他们补充说,HeatWave Gen AI的数据库内LLM支持,利用参数较少的较小的LLM,如在数据库内运行的Mistral-7B和Meta的Llama 3-8B,预计将降低企业的基础设施成本。
The Futurum Group的研究总监Ron Westfall说:“这种方法不仅减少了内存消耗,而且还允许使用CPU而不是GPU,使其具有成本效益,考虑到GPU的成本,这至少在短期内将成为一种趋势,直到AMD和英特尔赶上Nvidia。”
ISG的Ventana Research执行董事David Menninger说,在数据库中使用较小的LLM的另一个原因是能够通过微调对模型产生更大的影响。
Menninger解释说:“使用较小的模型,通过检索增强生成(RAG)技术提供的上下文对结果的影响更大。”
Westfall还举了IBM花岗岩模型的例子,表示使用较小模型的方法,特别是对于企业用例,正在成为一种趋势。
根据甲骨文的说法,数据库内LLM将允许企业搜索数据,生成或汇总内容,并使用HeatWave的Vector Store执行RAG。
另外,HeatWave Gen AI还与该公司的OCI生成服务集成,为企业提供来自LLM提供商的预培训和其他基础模型。
重塑矢量存储和横向扩展矢量处理
在过去12个月里,一些尚未提供专业矢量数据库的数据库供应商在其商品中添加了矢量功能——其中包括NoSQL的MongoDB、DataStax、Pinecone和CosmosDB——使客户能够在这些数据库中存储的数据上构建人工智能和基于人工智能的生成用例,而无需将数据移动到单独的矢量存储或数据库。
甲骨文的矢量商店已经在9月展示,在摄取数据后自动创建嵌入,以便更快地处理查询。
HeatWave Gen AI添加的另一项功能是横向扩展矢量处理,这将允许HeatWave支持VECTOR作为数据类型,进而帮助企业更快地处理查询。
Menninger说:“简而言之,这就像将RAG添加到标准关系数据库中。”“您将一些文本存储在表格中,并将该文本嵌入为矢量数据类型。然后,当您查询时,查询的文本将转换为嵌入。嵌入与表中的嵌入进行比较,距离最短的嵌入最相似。”
通过HeatWave聊天的图形界面
HeatWave Gen AI添加的另一项新功能是HeatWave Chat——MySQL Shell的Visual Code插件,它为HeatWave GenAI提供了一个图形界面,并使开发人员能够用自然语言或SQL提问。
Menninger说,保留聊天记录使开发人员更容易迭代细化搜索结果。
HeatWave Chat附带了另一个被称为Lakehouse Navigator的功能,它允许企业用户从对象存储中选择文件以创建新的矢量存储。
Westfall说,这种集成旨在提高开发人员和分析师构建矢量商店的用户体验和效率。