S的会计技能受到考验

AI伦理与社会1年前 (2023)发布 yundic

346 0 0

ChatGPT最近已经证明了其多学科性能，但数学技能仍然是它的致命弱点。

GPT—4模式征服了医学院考试、法学院的律师考试，甚至还征服了宾夕法尼亚大学沃顿商学院的MBA考试。律师考试（美国的法律考试）的表现达到了第90百分位数。

一大型研究发现ChatGPT在32名受试者中有9名击败了人类。令人钦佩，但绝不是世界一流的。

一最新研究由杨百翰大学会计学教授大卫伍德（David Wood）领导的一项研究，对该模型在会计领域的技能进行了测试，结果发现该模型在表现上明显不足。

对许多人来说，这似乎违反直觉。人工智能——一个数学系统——当然擅长数学问题吗？

目前情况并非如此。许多用户报告说，大型语言模型（LLM）与基本的数学函数相冲突。逻辑问题也会受到影响——由于模型无法系统地确定正确答案，因此脑筋急转弯很容易将ChatGPT排除在外。

伍德教授对这项研究采取了独特的方法，在社交媒体上联系研究人员进行众包参与。反应热烈，来自14个国家的186个教育机构的327名合著者参加了会议。他们都被列为研究作者。

S的会计技能受到考验

可能是同行评审研究中列出的最多的作者？资料来源：美国会计协会。

这种方法产生了一个惊人的27,000多个会计考试问题，这些问题来自不同领域和难度水平的ChatGPT。

尽管问题类型多样，涵盖了从财务会计到审计，从管理会计到税务，但结果是明确的。ChatGPT的得分为47.4%，远低于人类学生的平均得分76.7%。

人工智能在审计方面表现出了一定的能力，但在应对税务、财务和管理会计挑战时遭遇了困难。

为了对抗他们糟糕的数学技能，像Google Bard这样的LLMS将数学风格的问题设计成可执行代码，并以数字而不是语言的形式对其进行处理，但这也不完全可靠。

用伍德教授的话说，“当这项技术刚问世时，每个人都担心学生现在可以用它作弊，”他评论道。

“但作弊的机会一直存在。所以对我们来说，我们正试图专注于我们可以用这项技术做些什么，这是我们以前做不到的，以改善教师的教学过程和学生的学习过程。测试它是令人大开眼界的。”

所以，下次你计算你的财务状况或计算要缴纳的税款时，也许要坚持使用计算器，而不是依赖ChatGPT。

# AI伦理与社会

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

围绕生成人工智能的炒作开始平息了吗？

yundic

101

世界经济论坛呼吁制定政策解决人工智能在儿童发展中的作用

yundic

447

机器学习以令人难以置信的准确性破译波尔多葡萄酒的起源

yundic

104

我在1984年警告过你们，导演詹姆斯·卡梅隆谈到了人工智能。

yundic

556

病毒深度虚假广告针对Martin Lewis和Elon Musk

yundic

591

AI检测器歧视非英语母语人士，研究

yundic

206

暂无评论

暂无评论...