精品项目
首页 / Our Projects /使用 AI21 Labs 的任务特定模型在 AWS 上 机器学习博客使用 AI21 Labs 的任务特定模型在 AWS 上 机器学习博客
在AWS上使用AI21实验室的任务特定模型
作者 Joe Wilson Josh Famestad 以及 Pat Wilson 日期 2024年9月30日相关链接 Amazon SageMaker、Amazon SageMaker JumpStart、人工智能 、生成式AI
关键要点
在本博客中,我们将展示如何在AWS上利用AI21实验室的任务特定模型TSMs来提升业务运营。您将学习如何在AWS Marketplace上订阅AI21实验室、在Amazon SageMaker中设置领域以及通过SageMaker JumpStart使用AI21的TSMs。
在本文中,您将了解到如何通过AWS来增强您的业务操作。AI21实验室提供了众多高端语言模型,其中任务特定模型TSMs专注于解答问题、文本摘要以及信息压缩等应用。这些模型可以显著提高业务效率。
AI21的TSMs可以在SageMaker JumpStart中访问和自定义,具体包括: AI21 Contextual Answers AI21 Summarize AI21 Paraphrase AI21 Grammatical Error Correction
AI21的基础模型FMs,如Jamba Models和Jamba 15 Mini amp Large可在Amazon Bedrock中使用,适合大语言模型LLM用例。本文主要基于SageMaker Jumpstart中的AI21 TSM。
AI21的TSMs
基础模型可以解决多种任务,但并非每个任务都是独一无二的。一些商业任务在许多应用场景中都很常见。AI21实验室的TSMs是为解决特定问题而构建的专业模型,具有即用价值、成本效益和更高准确度。在本次中,我们将探讨三种AI21实验室的TSMs及其独特功能。
基础模型是基于大量数据集进行构建和训练,执行多种任务。与FMs不同,TSMs则专门针对某一任务进行训练。
当您的用例受益于TSM时,您将迅速体验到诸如拒绝率提高等好处,确保模型仅在基于实际文件内容的情况下提供答案。
Paraphrase:此模型用于增强内容创建和沟通,通过生成多样化的文本版本同时保持一致的语气和风格,适合创建多个产品描述、市场材料和客户支持回复等。
Summarize:该模型用于将冗长文本浓缩为简洁的摘要,同时保留原本的含义,非常适合处理大文件,如财务报告和法律文件。
Contextual Answers:该模型显著增强了信息检索和客户支持流程,能够根据特定文件内容提供准确和相关的答案。
前提条件
要遵循本篇的步骤,您需要具备以下前提条件:
AWS账户设置
完成本篇的实验需要一个AWS账户和设置好的SageMaker环境。如果您还没有AWS账户,请参考注册AWS账户的步骤。
AWS Marketplace订阅
用户可以通过Amazon Marketplace订阅AI21 TSMs,并部署SageMaker端点。您需要在AWS Marketplace中订阅以下产品:
AI21 SummarizeAI21 Contextual AnswersAI21 Paraphrase服务配额限制
要使用某些运行AI21任务特定模型所需的GPU,您需要相应的服务配额限制。您可以在AWS管理控制台请求增加服务配额限制。
如需创建服务请求,请在控制台搜索框中搜索服务配额。选择服务进入仪表板并输入GPU名称例如,mlg548xlarge。
预计成本
以下是进行本篇方案时的预计成本。
Contextual answers: 我们使用了mlg548xlarge 默认情况下,AWS账户无权访问此GPU。需申请服务配额限制增加。 笔记本运行时间约为15分钟。 成本为2041按小时计费。
Summarize笔记本: 我们使用了mlg4dn12xlarge GPU。 同样需要申请服务配额限制增加。 笔记本运行时间约为10分钟。 成本为494按小时计费。
Paraphrase笔记本: 同样使用mlg4dn12xlarge GPU。 需要申请服务配额限制增加。 笔记本运行时间约10分钟。 成本为494按小时计费。
魔方网络服务加速器总成本:3029每个部署的端点按1小时计费
在AWS上使用AI21模型
入门指南
在本节中,您将通过SageMaker Jumpstart访问AI21 TSM。 这些交互式笔记本包含部署TSM端点的代码和示例代码块。
如果您已设置SageMaker领域和用户名,可跳至第7步。
在AWS管理控制台的搜索栏中导航到Amazon SageMaker。如果您尚未设置域,请创建一个。域包含一个关联的EFS卷,以及多个安全、应用和网络配置。
选择 创建SageMaker域,然后选择 快速设置。
等待您的域创建完成。
选择 添加用户。
保持默认用户资料值。
通过选择 启动按钮并点击 Studio 启动Studio。
在导航面板中选择 JumpStart,找到可用的模型提供商。
选择 AI21 Labs 来查看他们的可用模型。
选择 AI21 Contextual Answers 模型卡,并探索相关笔记本。
选择 Notebooks 进行进一步探索。
要在JupyterLab中打开笔记本,选择 在JupyterLab中打开。
如果没有现有空间,请选择 创建新空间并输入名称。
选择创建空间并打开笔记本。
选择Python 3作为内核以开始使用。
笔记本练习导航
重复上述过程以导入其他笔记本。每个AI21笔记本展示了代码导入、版本检查、模型选择、端点创建及推理示例。

每个笔记本结束时有一个清理步骤,以删除已部署的端点,以避免额外成本。
Contextual Answers JumpStart笔记本
AWS客户和伙伴可以利用AI21的Contextual Answers模型改善客户支持流程。该模型能够依据特定上下文提供精确且相关的答案。
以下是AI21 Contextual Answers TSM的代码片段。可以看到,不需要复杂的提示工程,输入只是问题和提供的上下文。
输入:pythonfinancialcontext = 在2020年和2021年question = Omicron变种到来后,经济是否萎缩?response = clientanswercreate( context=financialcontext question=question)print(responseanswer)
输出:没有,经济在Omicron变种到来后并没有萎缩。
当您完成后,可以通过运行笔记本的最后两个单元结束已部署的端点。
Summarize JumpStart笔记本
AWS的客户和合作伙伴可利用AI21 Labs的Summarize模型将冗长文本浓缩成简洁摘要。此模型非常适合处理大型文档,如财务报告和法律文件。
以下是AI21 Summarize TSM的代码片段:pythontext = 错误影响了多个国际航班response = clientsummarizecreate( source=text sourcetype=DocumentTypeTEXT)print(摘要)print(responsesummary)
Paraphrase JumpStart笔记本
AWS客户和合作伙伴可以使用AI21 Labs的Paraphrase TSM来增强内容创建和沟通。pythontext = 我们将探索Paraphrase模型的优点和特点。response = clientparaphrasecreate( text=text style=formal)print(responsesuggestions)
减少提示工程
AI21的任务特定模型相比于基础模型减少了复杂的提示工程需求。
使用AI21的Summarize TSM比使用基础模型的复杂模板更直接,您只需将输入文本直接传递给模型,无需构建复杂的提示模板。
降低成本与提高准确度
使用TSMs可以实现更低的成本和更高的准确度,具有更高的拒绝率。这对于对错误答案要求不容忍的用例非常有利。
结论
在本文中,我们探讨了AI21实验室通过任务特定模型TSMs实现生成式AI的方式。通过指导练习,您了解了如何设置SageMaker领域并导入示例JumpStart笔记本来实验AI21的TSMs。
您看到与基础模型相比,任务特定模型的潜在优势。在相关领域外提问时,AI21 TSMs拒绝回答,减少了小错误或生成无意义输出的可能性,这是精确和安全性需求极其重要的应用领域。最后,我们强调了任务特定模型从一开始就设计为在特定任务上脱颖而出,简化开发流程,减少了对复杂提示工程和微调的需求,从而使其成为更具成本效益的解决方案。
无论您是一名数据科学家、机器学习从业者,还是对AI进展感兴趣的个人,我们希望本文能为您提供关于AI21 Labs任务特定方法的宝贵见解。随着生成式AI领域的快速发展,请保持好奇,尝试各种方法,并最终选择最适合项目独特需求和目标的方案。更多示例用例和代码,请访问 AWS GitHub。
附加资源
AI21实验室通过生成式AI转型业务亚马逊SageMaker开始使用Amazon SageMaker JumpStart亚马逊Bedrock任务特定模型概述关于作者
Joe Wilson是亚马逊网络服务AWS的解决方案架构师,专注于支持非营利组织,并在数据分析、AI/ML和生成式AI方面有较强的专业技能。
Pat Wilson是AWS的解决方案架构师,着重于AI/ML工作负载和安全性,支持联邦合作伙伴。
Josh Famestad是AWS的解决方案架构师,与公共部门客户合作,开发基于云的解决方案以推动商业优先事项。
搜索
最新内容
集中化还是分散化? 云企业战略博客
迁移到AWS Cloud WAN多区域检查使用服务插入 网络与内容交付
生成式 AI 问答评估的真实情况策展与指标解读最佳实践 机器学习博客
支持加拿大的 CCCS PBHVA 覆盖合规性与 AWS 的着陆区加速器 安全博客