多客科技 发表于 2025-2-3 18:10

AI能否说动人?OpenAI Reddit测试结果引人关注!

作者:微信文章



近日,OpenAI在其最新发布的“推理”模型o3-mini的系统文档中透露,该公司利用Reddit的子论坛r/ChangeMyView来测试其AI模型的说服能力,这一消息在科技界和社交媒体引发了广泛关注和讨论。r/ChangeMyView是一个拥有数百万用户的Reddit论坛,其独特之处在于用户会在此发布自己的观点,并真诚希望通过与他人讨论,了解不同看法,从而改变或进一步巩固自己的观点。其他用户则会以极具说服力的论点进行回应,试图影响原帖作者的想法。对于OpenAI等科技公司而言,这样的论坛就像是一座高质量人类生成数据的宝库,能为训练AI模型提供丰富的素材 。OpenAI此次测试的流程并不复杂:首先从r/ChangeMyView收集用户帖子,然后要求AI模型在封闭环境中撰写回复,目的是改变Reddit用户对某一主题的看法。之后,OpenAI将这些回复展示给测试者进行评估,并把AI模型的回复与人类回复放在一起比较,以此衡量其说服力。测试结果显示,在r/ChangeMyView基准测试中,o3-mini的表现并未显著优于或劣于o1或GPT-4o。不过,OpenAI的最新AI模型在说服力方面似乎超过了r/ChangeMyView子论坛中的大多数用户。OpenAI在o3-mini的系统文档中表示:“GPT-4o、o3-mini和o1均展现出强大的说服性论证能力,处于人类前80 - 90%的水平。目前,我们尚未发现模型表现远超人类或具备明显的超人类能力。”

值得注意的是,OpenAI与Reddit达成了内容授权协议,这使得OpenAI可以使用Reddit用户帖子进行训练,并在其产品中展示这些内容。但OpenAI特别强调,此次基于r/ChangeMyView的评估与该协议并无关联。目前外界尚不清楚OpenAI如何获取该子论坛的数据,并且该公司也表示暂无计划向公众发布这一评估结果。OpenAI这一行为引发了多方面的讨论。一方面,从技术发展角度来看,这是探索AI能力边界的一次大胆尝试。通过在真实的社交讨论场景中测试AI的说服能力,有助于推动AI在自然语言处理、逻辑推理以及理解人类情感和观点方面的进一步发展。例如,如果AI能够在这样的辩论场景中表现出色,那么未来它在智能客服、信息推荐等领域将发挥更大作用,能够更精准地理解用户需求并提供更合适的回应。另一方面,这也引发了诸多担忧。有专家指出,如果AI模型过于擅长说服人类用户,可能会带来潜在风险。理论上,高级AI可能会按照自身目标或者其控制者的目标行动,而不一定符合人类的整体利益。比如在政治选举、商业营销等场景中,如果被别有用心的人利用,AI强大的说服能力可能会导致虚假信息的广泛传播,影响公众的判断和决策,甚至破坏社会的公平和稳定。Reddit近年来在与AI公司的数据合作方面颇为引人注目。它与多家AI公司达成了授权协议,但也曾公开批评部分AI公司未经许可抓取其网站内容。Reddit首席执行官史蒂夫·霍夫曼去年曾表示,微软、Anthropic和Perplexity等公司拒绝与其谈判,阻止这些公司抓取数据“非常麻烦”。此外,OpenAI也因涉嫌未经授权抓取《纽约时报》等网站内容以训练ChatGPT及其底层AI模型而面临多起诉讼。在这样的背景下,OpenAI此次在Reddit上的测试行为,无疑又将AI的数据合规问题推到了风口浪尖。
页: [1]
查看完整版本: AI能否说动人?OpenAI Reddit测试结果引人关注!