丹麦研究人员使用人工智能预测过早死亡的风险

559 0 0

一个使用丹麦综合个人数据开发的人工智能系统在预测个人死亡风险方面显示出惊人的准确性。

这个人工智能，记录在这项研究发表在《自然计算科学》杂志上由丹麦技术大学的Sune Lehmann Jørgensen和他的团队创建。

他们分析了一个庞大的数据集，其中概括了丹麦人口中的众多因素，包括教育、就医、诊断、收入和职业数据，这些数据来自2008年至2020年的600万人。

然后，这些数据被转换成适合训练大型语言模型（LLM）的格式。不该团队的Life2vec模型回顾了一个人的生活事件，并预测了可能的未来结果，类似于LLM处理语言的方式。

为了测试Life2vec，该团队保留了最后四年的数据，并将重点放在35岁至65岁的人身上，其中一半人在2016至2020年间去世。

Life2vec对谁可能存活或无法存活的预测比任何现有的人工智能模型和精算生命表（保险业使用）高出约11%。它还被用来预测个性结果，展示了该模型将大规模的社会投入映射到个人层面的产出的能力。

Jørgensen设想这一模式作为早期发现健康和社会问题的工具，有可能帮助政府减少健康和社会不平等。它揭示了死亡率与经济、劳动力、收入水平和出生年份之间的关系，为探索这些类型的宏观人口因素对个人健康的影响提供了另一种途径。

然而，Jørgensen警告说，防范潜在的业务滥用，特别是在保险业，因为这可能会破坏分担风险的基本原则。

如果保险公司使用人工智能来确定特定个人何时面临更大的死亡风险，这将引发一场复杂的伦理辩论。这与人工智能的其他预测用途有一些相似之处，例如预测性警务方案在个人实施可能的犯罪之前，他们将其列为潜在的“嫌疑犯”。

Jørgensen说，“显然，我们的模式不应该被保险公司使用，因为保险的整个理念是，通过分享对谁将成为遭遇事故、死亡或失去背包的不幸之人的缺乏知识，我们可以在某种程度上分担这一负担。”

更多关于这项研究的信息

以下是关于这项研究的目的、新颖的方法以及它如何工作的更多信息：

数据收集和转换研究小组收集了一个涵盖丹麦整个人口的广泛数据集，从2008年到2016年，包括大约600万居民。该数据集包含了各种生活事件的详细日常记录，包括健康事件、教育水平、就业状况、收入水平、居住和工作时间。
为生活事件创建合成语言研究人员将这些生活事件转换成类似于语言的格式，从而能够使用自然语言处理技术。他们把每一个生活事件看作一个由“概念令牌”组成的“句子”，其中包括事件类型、收入水平和工作类型等详细信息。
Life2vec模型的开发：使用变压器架构，团队开发了模型。这个模型可以捕捉不同生活事件之间的复杂关系，就像LLM理解单词之
预测性分析和测试：Life2vec测试了其预测各种结果的能力，特别是早期死亡率和人格特征。对于死亡率预测，该模型评估了2016年后存活4年的个体的可能性。它在这方面的表现优于传统模式。
理解和解释模型：研究人员使用概念激活向量(TCAV)等方法来解释模型的预测。这涉及到确定与不同的生活结果或特征相对应的生活方向。通过分析这些方向，他们深入了解了就业状况或健康诊断等因素如何影响模型的预测。

使用人工智能来预测重要的生活事件，死亡无疑是最重要的事件之一，是一个诱人的前景。

虽然它的好处和风险是紧密平衡的，但类似的应用程序已经被引导到一个积极的结果，就像过去的这种模式预测青少年自杀和自残.在一般医疗保健领域，预测建模有助于确定高危人群的治疗优先次序。

然而，正如Jørgensen所承认的那样，还需要努力保护这些技术的道德使用。