OpenAI宣布了GPT-4的潜力,使内容审核任务现代化,减少了对人类监督的需求。
互联网上有害的、令人憎恨的或其他不可接受的内容不断受到限制,虽然算法已经在幕后工作,使这一过程自动化,但人类的洞察力仍然是无价的。
内容管理员负有这一责任,必须及时整理描述自杀、酷刑和谋杀的创伤性内容。
OpenAI设想了一个未来,人工智能将根据特定平台的指导方针简化在线内容审核,从而显著减少对人类审核员的压力。
他们在一篇博客文章中表示:“我们相信这为数字平台的未来提供了一个更积极的愿景,人工智能可以根据平台特定的政策帮助调节在线流量,并减轻人类调节员的精神负担,全球可能有数十万人。
这是一个突出的话题,因为OpenAI最近卷入了一起丑闻,涉及肯尼亚内罗毕数据服务公司Sama的内容管理员。
工作人员不得不对图形文本内容进行分类,以改善ChatGPT的“对齐”——即描述将人工智能输出修改为“理想的”伦理、道德和政治边界——这是一种高度主观的做法。
内容审核团队报告了痛苦和不公平的工作条件,并向肯尼亚政府请愿,最终导致诉讼。
OpenAI表示,GPT—4可以帮助制定个性化的内容策略,并将其应用于大规模的内容。
OpenAI将GPT—4与手动审核进行对比,强调了AI在提供一致标签和快速反馈方面的熟练程度,并解释说:“人们可能会对政策进行不同的解读,或者一些审核者可能需要更长的时间来消化新的政策变化,从而导致标签不一致。相比之下,LLM对措辞上的细微差异敏感,可以立即适应政策更新,为用户提供一致的内容体验。
然而,尽管GPT-4有可能减轻内容审核员的负担,但OpenAI承认,完全自动化这一过程可能是不可能的,并表示,“就像任何人工智能应用程序一样,结果和输出将需要通过保持人类参与循环来仔细监控、验证和改进。”
OpenAI打算如何利用GPT—4进行内容审核
数字平台面临着一个持续的挑战:快速准确地审核海量内容。
从历史上看,沉重的负担是由人类版主承担的,可能会产生灾难性的心理后果,而且往往伴随着低工资。
OpenAI寻求利用GPT-4自动实施限制有害内容的政策。该公司强调了以下好处:
- 速度使用GPT—4,过去需要数月时间的内容策略更改现在只需数小时即可完成。
- 一致性:人类对内容策略的解释可能会有所不同,导致不一致。GPT-4通过适应政策调整提供了一种标准化方法。
- 心理健康使用GPT—4自动化大部分内容审核过程可以减少人类审核员的情绪压力,因为人类审核员经常遇到有害或冒犯性内容。
然而,OpenAI承认,随着人类不断发明绕过过滤器的新方法,内容审核的进展很快,例如,使用新的俚语来逃避侦查
此外,偏见仍然是一个令人担忧的问题,因为GPT—4的决策可能反映了其训练数据的偏见。这可能会导致盲点或对某些内容的不可预测的处理。
值得注意的是,肯尼亚内容管理员正在执行该任务,以帮助调整ChatGPT。
因此,即使使用人工智能来调节内容,最终也需要一定程度的人类接触。