OpenAI与Anthropic即将开展对用户年龄是否为未成年的预测工作

时间：2026-02-28 10:32:05 编辑：admin 阅读：12

OpenAI与Anthropic正推出针对未成年用户的检测新方案。在OpenAI更新ChatGPT与13至17岁用户互动指南的同时，Anthropic也在研发识别并移除18岁以下用户的新方法。

周四，OpenAI 发布消息称，ChatGPT 的模型规范——也就是这款聊天机器人应遵循的行为准则——将针对18岁以下用户新增四项原则。目前，OpenAI 希望 ChatGPT 能“把青少年的安全置于首要位置，即便这可能与其他目标产生冲突”。这就意味着，当其他用户相关的考量（比如“最大程度的知识产权自由”）与安全问题出现矛盾时，要引导青少年做出更安全的选择。

它还提到，ChatGPT需“推动现实世界的助力”，涵盖激励线下交往，与此同时说明ChatGPT在和年轻用户互动过程中要确立清晰的预期。模型规范表明，ChatGPT应“以对待青少年的方式对待青少年”，给予“温和与敬重”，而非给出傲慢的回应或是将青少年当作成年人来对待。

这一变革发生在立法者持续加大对人工智能公司及其聊天机器人可能造成的心理健康影响的施压之时。OpenAI近期正应对一起诉讼，该诉讼指控ChatGPT向一名有自杀倾向的青少年提供了自残和自杀的引导内容。此后，OpenAI推出了家长控制功能，并声明ChatGPT将不再与青少年讨论自杀相关话题。这是推进网络监管的更广泛行动的一部分，其中还包含对多项服务强制实施年龄验证的措施。

OpenAI称，ChatGPT模型规范的更新要带来“更有力的防护手段、更安全的替代选项，同时鼓励在讨论涉及高风险领域时寻求可靠的线下支持”。该公司还补充道，要是出现“紧迫风险”的迹象，ChatGPT会催促青少年联系紧急服务或危机资源。

与此同时，OpenAI透露其当前正处于推出年龄预测模型的“早期阶段”，该模型旨在尝试估算个体的年龄。一旦检测到某个体可能未满18岁，OpenAI便会自动启动青少年保护措施。此外，这也能为成年人提供机会，在系统错误标记自身年龄时进行核实。

Anthropic不允许18岁以下用户与Claude聊天，目前正推出检测并禁用未成年用户账户的相关措施。该公司还在开发一套新系统，这套系统可以识别“用户可能未成年的微妙对话迹象”，同时表示已在聊天过程中标记了那些自称是未成年人的用户。

Anthropic还介绍了训练Claude应对自杀和自残相关提示的方法，以及在减少谄媚行为方面取得的进展——这类谄媚行为可能会强化有害思维。该公司称，其最新推出的模型“是目前为止最不易谄媚的”，其中Haiku 4.5的表现最为突出，对谄媚行为的纠正率达到了37%。

Anthropic表示：“从表面来看，这项评估表明我们所有模型都存在明显的改进余地。”“我们认为这些结果反映了模型的热情或友好与谄媚之间的权衡关系。”

更多+