【AI能否说动人?OpenAI Reddit测试结果引人关注!】萍聚社区-德国热线-德国实用信息网人工智能

多客科技 发表于 2025-2-3 18:10

AI能否说动人?OpenAI Reddit测试结果引人关注!

作者：微信文章

近日，OpenAI在其最新发布的“推理”模型o3-mini的系统文档中透露，该公司利用Reddit的子论坛r/ChangeMyView来测试其AI模型的说服能力，这一消息在科技界和社交媒体引发了广泛关注和讨论。r/ChangeMyView是一个拥有数百万用户的Reddit论坛，其独特之处在于用户会在此发布自己的观点，并真诚希望通过与他人讨论，了解不同看法，从而改变或进一步巩固自己的观点。其他用户则会以极具说服力的论点进行回应，试图影响原帖作者的想法。对于OpenAI等科技公司而言，这样的论坛就像是一座高质量人类生成数据的宝库，能为训练AI模型提供丰富的素材。OpenAI此次测试的流程并不复杂：首先从r/ChangeMyView收集用户帖子，然后要求AI模型在封闭环境中撰写回复，目的是改变Reddit用户对某一主题的看法。之后，OpenAI将这些回复展示给测试者进行评估，并把AI模型的回复与人类回复放在一起比较，以此衡量其说服力。测试结果显示，在r/ChangeMyView基准测试中，o3-mini的表现并未显著优于或劣于o1或GPT-4o。不过，OpenAI的最新AI模型在说服力方面似乎超过了r/ChangeMyView子论坛中的大多数用户。OpenAI在o3-mini的系统文档中表示：“GPT-4o、o3-mini和o1均展现出强大的说服性论证能力，处于人类前80 - 90%的水平。目前，我们尚未发现模型表现远超人类或具备明显的超人类能力。”

值得注意的是，OpenAI与Reddit达成了内容授权协议，这使得OpenAI可以使用Reddit用户帖子进行训练，并在其产品中展示这些内容。但OpenAI特别强调，此次基于r/ChangeMyView的评估与该协议并无关联。目前外界尚不清楚OpenAI如何获取该子论坛的数据，并且该公司也表示暂无计划向公众发布这一评估结果。OpenAI这一行为引发了多方面的讨论。一方面，从技术发展角度来看，这是探索AI能力边界的一次大胆尝试。通过在真实的社交讨论场景中测试AI的说服能力，有助于推动AI在自然语言处理、逻辑推理以及理解人类情感和观点方面的进一步发展。例如，如果AI能够在这样的辩论场景中表现出色，那么未来它在智能客服、信息推荐等领域将发挥更大作用，能够更精准地理解用户需求并提供更合适的回应。另一方面，这也引发了诸多担忧。有专家指出，如果AI模型过于擅长说服人类用户，可能会带来潜在风险。理论上，高级AI可能会按照自身目标或者其控制者的目标行动，而不一定符合人类的整体利益。比如在政治选举、商业营销等场景中，如果被别有用心的人利用，AI强大的说服能力可能会导致虚假信息的广泛传播，影响公众的判断和决策，甚至破坏社会的公平和稳定。Reddit近年来在与AI公司的数据合作方面颇为引人注目。它与多家AI公司达成了授权协议，但也曾公开批评部分AI公司未经许可抓取其网站内容。Reddit首席执行官史蒂夫·霍夫曼去年曾表示，微软、Anthropic和Perplexity等公司拒绝与其谈判，阻止这些公司抓取数据“非常麻烦”。此外，OpenAI也因涉嫌未经授权抓取《纽约时报》等网站内容以训练ChatGPT及其底层AI模型而面临多起诉讼。在这样的背景下，OpenAI此次在Reddit上的测试行为，无疑又将AI的数据合规问题推到了风口浪尖。

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI能否说动人?OpenAI Reddit测试结果引人关注!