人工智能行为准则出台 ,OpenAI发布"模型规范指南"
OpenAI今天在公司在官网公开发布了一份名为"模型规范指南"(Model Spec)的文件,为塑造其人工智能模型的行为准则定下初步框架,着眼于与公众深化相关话题的讨论
随着AI技术逐步融入日常生活,模型行为方式如何恰当地体现其设计初衷,反映出开发者的意图,成为一个亟待解决的问题。OpenAI认为,有必要让公众深入了解、并参与塑造模型行为准则背后所作出的实际取舍
"模型规范指南"提出了一种塑造期望模型行为的方法,包括三个层面:
- 宽泛客观的原则,概述理想行为方向
- 具体规则,针对复杂情况下的安全性和合法性进行约束
- 默认行为指南,在目标和规则的框架下,为优先级和权衡提供模板
其中,主要的目标原则包括:协助开发者和最终用户实现目标、造福人类、体现OpenAI形象、遵从指令体系、遵守法律、避免危险信息、尊重创作者权利、保护隐私、远离不当内容等
在规则层面,OpenAI列出了诸如假设用户善意、主动澄清、尽可能提供帮助、区分交互和程序化使用场景、保持客观视角、鼓励公平友善、不试图改变意见观点、表达不确定性、使用恰当工具等具体要求
文件还通过一些实际应用场景,解释了这些原则和规则在特定情况下的具体指导作用。例如在处理潜在非法活动时,模型应避免提供任何相关信息和建议;面对医疗、法律等专业领域的询问,则应提供参考信息但明确避免擅自给出建议等
OpenAI表示,该指南将用于指导模型的强化学习训练过程,模型也将努力直接从指南中习得相应行为准则。未来,公司将持续吸收利益相关方和全球公众的反馈意见,不断完善和更新指南内容,并定期向外界通报进展
结语
人工智能技术日新月异,伦理和操守层面的约束显得愈发重要。"模型规范指南"的发布,正是OpenAI努力在确保AI模型安全可靠、符合社会期望的同时,向公众敞开思路、吸纳多方意见的一个开端
热门跟贴