S的会计技能受到考验

AI伦理与社会1年前 (2023)发布 yundic
346 0 0

ChatGPT最近已经证明了其多学科性能,但数学技能仍然是它的致命弱点。

GPT—4模式征服了医学院考试、法学院的律师考试,甚至还征服了宾夕法尼亚大学沃顿商学院的MBA考试。律师考试(美国的法律考试)的表现达到了第90百分位数。

大型研究发现ChatGPT在32名受试者中有9名击败了人类。令人钦佩,但绝不是世界一流的。

最新研究 由杨百翰大学会计学教授大卫伍德(David Wood)领导的一项研究,对该模型在会计领域的技能进行了测试,结果发现该模型在表现上明显不足。

对许多人来说,这似乎违反直觉。人工智能——一个数学系统——当然擅长数学问题吗?

目前情况并非如此。许多用户报告说,大型语言模型(LLM)与基本的数学函数相冲突。逻辑问题也会受到影响——由于模型无法系统地确定正确答案,因此脑筋急转弯很容易将ChatGPT排除在外。

伍德教授对这项研究采取了独特的方法,在社交媒体上联系研究人员进行众包参与。反应热烈,来自14个国家的186个教育机构的327名合著者参加了会议。他们都被列为研究作者。

S的会计技能受到考验

可能是同行评审研究中列出的最多的作者?资料来源:美国会计协会。

这种方法产生了一个惊人的27,000多个会计考试问题,这些问题来自不同领域和难度水平的ChatGPT。

尽管问题类型多样,涵盖了从财务会计到审计,从管理会计到税务,但结果是明确的。ChatGPT的得分为47.4%,远低于人类学生的平均得分76.7%。

人工智能在审计方面表现出了一定的能力,但在应对税务、财务和管理会计挑战时遭遇了困难。

为了对抗他们糟糕的数学技能,像Google Bard这样的LLMS将数学风格的问题设计成可执行代码,并以数字而不是语言的形式对其进行处理,但这也不完全可靠。

用伍德教授的话说,“当这项技术刚问世时,每个人都担心学生现在可以用它作弊,”他评论道。

“但作弊的机会一直存在。所以对我们来说,我们正试图专注于我们可以用这项技术做些什么,这是我们以前做不到的,以改善教师的教学过程和学生的学习过程。测试它是令人大开眼界的。”

所以,下次你计算你的财务状况或计算要缴纳的税款时,也许要坚持使用计算器,而不是依赖ChatGPT。

© 版权声明

相关文章

暂无评论

暂无评论...