Patronus AI推出用于AI评估和护栏的自助API|patronus|人工智能|大模型

Patronus AI宣布推出Patronus API，这是第一个自助解决方案，使开发人员能够可靠地检测和预防生产中的人工智能故障。有了Patronus API，企业现在可以以无与伦比的精度和修正率保护其生成式人工智能系统免受幻觉、安全风险和意外行为的影响。

许多公司面临着生产中失败的生成性人工智能系统的持续挑战，导致幻觉、即时攻击和安全风险等问题。目前的解决方案已被证明不可靠，Llama Guard和Prompt Guard等模型准确率低于50%。Patronus API提供业界最可靠的护栏，在人工智能评估任务中具有高性能的精度和召回率。此外，开发人员受益于灵活的、基于使用的定价模型，使其比需要管理开源模型和基础设施的传统解决方案更容易获得。

Patronus AI是第一个自动化的AI评估和安全平台，可以帮助公司安全、自信地使用大型语言模型（LLM）。

Patronus AI首席执行官Anand Kannappan表示：“许多公司都在努力应对人工智能在生产中的失败，面临幻觉、安全漏洞和不可预测的行为等问题，而当前的解决方案未能有效解决这些问题。Patronus API为这些挑战提供了可靠的解决方案，提供了前沿的模型，如Lynx幻觉检测模型，以及灵活的基于用户的定价结构。现在，开发人员可以使用最准确的护栏来测试和保护他们的人工智能系统，而无需大量的研究和计算投资。”

Patronus API使开发人员能够访问Patronus AI研究团队训练的尖端评估模型。这包括Patronus AI的旗舰幻觉检测模型Lynx，它在检测检索增强生成（RAG）系统中的不准确之处方面优于GPT-4o。Patronus API还提供了配置LLM的灵活性，以评估自定义标准-交叉能力、安全性和对准，使其成为任何人工智能用例的通用解决方案。

开发人员还可以访问WEB仪表板来跟踪和过滤Patronus API日志，比较人工智能产品性能快照，并对不同的LLM系统进行实验。他们还可以使用Patronus策划的各种数据集，包括FinanceBench、EnterprisePII和SimpleSafetyTests，对他们的人工智能产品进行有针对性的测试。

主要功能和优点：

无与伦比的性能：Patronus API的评估模型是市场上最可靠的，提供了卓越的准确性和降低的延迟。

小型和大型评估器：为实时和离线用例量身定制的选项，提供部署灵活性。

全面合规性：遵守OWASP和NIST等行业标准，确保您的AI系统保持合规性和安全性。

用户友好：API是一种编程语言，具有Python SDK，可用于轻松集成。

自定义LLM判断：开发人员可以在平台中为特定用例配置自己的LLM判断，并通过Patronus API访问它们。

用户可以在app.patronus.ai上注册，创建API密钥，并立即获得5美元的免费积分。按需付费定价消除了进入壁垒，而企业客户可以使用更高的费率限制、自定义评估模型、webhooks和AI专业服务等高级功能。

Patronus AI的基准测试结果一致表明，它在评估准确性和速度方面比Ragas等类似解决方案高出20%。与其他工具不同，Patronus AI提供了一个完整的用户体验平台，用于监控评估结果、运行实验和比较随时间变化的性能。Patronus AI受到AngelList、Pearson、惠普等领先公司的信赖。该公司还在扩大其合作伙伴生态系统，其中包括NVIDIA、MongoDB、IBM等行业领导者。