随着更新,生成人工智能驱动的功能现在支持模式启用,并将整体文档页数限制增加到3000页。
AWS更新了其生成人工智能服务Amazon Bedrock中的数据自动化功能,以进一步支持从非结构化数据生成见解的自动化,并减少构建由大型语言模型(LLM)支持的应用程序所需的开发时间。
据AWS称,Bedrock的数据自动化针对的开发人员,他们可以通过帮助以简化的方式构建组件或工作流程,如自动数据分析以获取见解,从而加速生成性人工智能驱动的应用程序的开发。
AWS将数据自动化与Bedrock的知识库功能集成,帮助开发人员从非结构化多模态数据中提取信息,并将其用作检索增强生成(RAG)用例的上下文。
数据自动化的最新更新包括对模式启用、按文件类型进行模式路由、处理文档时提取嵌入式超链接以及将文档页面限制提高到3000页的总体支持。
AWS在一篇博文中写道:“这些新功能可让您更好地控制多模态内容的处理方式,并提高了基岩数据自动化的整体文档提取能力。”
AWS表示,企业开发人员可以使用模式启用功能来配置特定项目或应用程序的所有数据中处理的模式——图像、文档、音频和视频。
开发人员还可以选择将特定文件类型作为模式路由,这意味着开发人员将能够将JPEG或JPG文件作为文档处理,并将MP4或M4V文件作为视频文件,而不是通过数据自动化将原始图像或音频类型处理。
数据自动化添加的另一个功能是嵌入PDF中发现的超链接,作为输出或生成的见解的一部分。
云服务提供商写道:“此功能增强了文档中的信息提取功能,为知识库、研究工具和内容索引系统等应用程序保留了有价值的链接引用。”
此外,AWS还增加了对Bedrock数据自动化中处理文档的支持,从每个文档1500页到每个文档3000页。
云服务提供商表示,增加限制将使开发人员能够在不拆分的情况下处理更大的文档,并补充说,这也简化了处理长文档或文档包的企业的工作流程。目前,亚马逊基岩数据自动化在美国西部(俄勒冈州)和美国东部(弗吉尼亚州北部)地区普遍可用。