最近AI领域最为爆炸的新闻,当属OpenAI的最强竞争对手Anthropic推出Claude 3系列模型,新一代Claude 3模型拥有更快的响应性能、完整的视觉功能、以及更少的幻觉现象,并在基准测试上树立了新的标准,性能超越了包括GPT-4在内的其他模型,可谓是彻底把GPT-4拉下了神坛。
值得一提的是,此次推出的Claude3共有三个模型,包括超大杯Claude 3 Opus、大杯Claude 3 Sonnet和中杯Claude 3 Haiku,三个模型均提供200k长度的上下文,并针对不同的用例进行了优化。
具体来说,超大杯Claude 3 Opus是三个模型中最为先进且最为强大的大模型,具有深度推理、高级数学和编码能力,在高度复杂的任务上具有顶级性能。它可以非常流畅地导航开放式提示和新颖场景,包括任务自动化、假设生成以及图表、图形和预测的分析;大杯Claude 3 Sonnet在智能和速度之间实现了平衡,适用于绝大多数工作负载,速度比Claude 2和Claude 2.1快2倍,且智能水平更高。它擅长执行需要快速响应的智能任务,例如知识检索或销售自动化;中杯Claude 3 Haiku的优势则在于速度和成本效益,这是一种快速紧凑的模型,具有近乎即时的响应能力。
基准性能方面,用Anthropic的话来说,Claude 3系列模型在推理、数学、编码、多语言理解和视觉方面,都树立了新的行业基准,其中最为强大的Opus在人工智能系统的大多数常见评估基准上都优于包括GPT-4在内的大模型,包括本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等,它对复杂任务表现出了高水平的理解力和流畅性,并且在处理复杂任务时,展现了几乎与人类相媲美的理解和表达能力,称之为AGI领域的领跑者也不为过。
视觉功能方面,Claude 3的三类模型均提供了视觉功能,可以理解不同格式的结构化和非结构化数据,不仅是语言,还包括图像、图表、图表等。这使得企业能够构建集成不同多媒体源并解决真正跨领域问题的生成式人工智能应用程序。例如,制药公司可以查询药物研究论文以及蛋白质结构图,以加速发现;媒体组织可以自动生成图像标题或视频脚本等等。
安全性方面,Claude 3系列依然贯彻了Anthropic“以更负责任的方式推进生成式AI”的初心,为此Anthropic还专门组建了多个团队,致力于从虚假信息、生物安全滥用、选举干预等方面降低风险,并努力增强模型的安全性的透明度,同时减少隐私问题。具体来说,Claude 3模型通过宪法AI技术减轻幻觉现象,这些技术提供了对模型推理过程的透明度,并且提高了准确性。Claude 3 Opus在困难的开放式问题上比Claude 2.1显示出2倍的预估准确性增益,降低了错误响应的可能性。随着企业客户依赖Claude跨越医疗、金融和法律研究等行业,减少幻觉现象对于安全性和性能至关重要。Claude 3家族为可靠的生成式AI输出树立了新标准。
截至目前,Opus和Sonnet已经可以在claude.ai以及覆盖159个国家的Claude API上使用了,Haiku也将很快推出。此外Claude 3 Sonnet已经可以通过Amazon Bedrock使用,Claude 3 Opus和Claude 3 Haiku也将很快在Amazon Bedrock推出。
为什么Amazon Bedrock成为了率先支持Claude 3 Sonnet的托管服务?答案很简单,亚马逊云科技不仅是Anthropic的云服务提供商,二者在生成式AI方面的合作也十分紧密,如亚马逊云科技数据和AI副总裁Swami Sivasubramanian博士在最近的博客文章中所说的那样,“回顾2021年,当Anthropic第一次开始在亚马逊云科技上构建时,没有人能想到Claude系列模型会带来多大的变革。自Amazon Bedrock于2023年9月28日全面上线以来的短短几个月内,已有超过10000名客户使用它,其中许多客户正在使用Claude。今天,下一代Claude——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku将登陆Amazon Bedrock,这是一个令人兴奋的里程碑事件。”
作为亚马逊云科技推出的全托管式生成式AI服务,Amazon Bedrock堪称利用大模型构建和扩展生成式人工智能应用的最简单方法。开发人员无需管理任何的基础设施和配置,即可以云原生的方式快速进行生成式AI应用的开发。各行各业的客户已经在使用Amazon Bedrock重塑他们的用户体验、产品和流程,并将人工智能带入他们的业务核心。这些都得益于Amazon Bedrock提供的独特优势,包括推出的模型评估功能能够帮助客户识别、比较和选择最适合的模型;知识库功能能够简化生成式AI应用构建并利用专有数据提供基于最新内容的定制化响应;模型调优功能支持对更多先进模型进行调优;代理功能可支持生成式AI应用在确保安全和隐私保护的情况下执行多步骤业务指令;Guardrails功能可更好地帮助实现负责任AI等等。
因此,在Claude 3 Sonnet登陆Amazon Bedrock后,企业能够根据其业务和场景的特定需求,轻松使用Anthropic的最新模型进行构建。这不仅包括自然语言模型,还包括扩展的多模式人工智能模型,能够跨文本、图像、图表等进行高级推理。
亚马逊云科技一直认为没有一种模型可以满足所有需求,因此Amazon Bedrock与全球领先的大模型供应商合作,为用户提供领先大模型选择,这也成为了亚马逊云科技与大模型全球顶级玩家的差异化优势。截至目前,Amazon Bedrock的大模型供应商共有AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI七家。其中Mistral AI的两种高性能模型Mistral 7B和Mixtral 8x7B也已经在Amazon Bedrock正式可用,前者是Mistral AI推出的首个基础模型,支持英语文本生成任务并具备自然编码能力。而后者则采用当下备受关注的MoE(优质稀疏专家混合)技术,功能比Mixtral 7B更强大,可支持英语、法语、德语、西班牙语和意大利语文本生成任务并具备自然编码能力,非常适用于文本摘要、问题解答、文本分类、文本完善和代码补全等使用案例。
现如今,以人工智能为代表的新一轮科技浪潮正在引领整个社会走向第四次工业革命,特别是生成式AI的火热,正在为各行各业带来全面的重塑,创造更多的价值。不过对具体的企业来说,自身在生成式AI方面的需求实际上是随着业务场景和行业属性而变化的,所谓一个模型走天下的情况在现实世界几乎不可能存在。模型选的太复杂,可能会大材小用,选择能力不足的模型,则会白白浪费企业的成本投入。Amazon Bedrock本身就解决了相当一部分模型选择的问题,而此次Claude 3 Sonnet的加入,无疑又为那些想要通过基础模型构建生成式AI应用程序的企业带来了更多选择。