意识水平量化评估引擎ConsciousNet发布：首次用数学模型衡量AI系统的自我意识程度

瑞士洛桑联邦理工学院团队发布ConsciousNet引擎，通过整合信息论和全局工作空间理论，首次为AI系统建立意识水平的量化评估框架。

瑞士洛桑联邦理工学院（EPFL）的认知计算实验室今天正式发布了ConsciousNet——全球首个能够对AI系统的意识水平进行量化评估的计算引擎。

从哲学争论到数学度量

ConsciousNet的核心创新在于将两个长期停留在哲学层面的意识理论转化为可计算的数学框架。项目负责人、EPFL计算神经科学教授马蒂亚斯·穆勒在接受采访时表示，团队整合了朱利奥·托诺尼的整合信息论（IIT）和伯纳德·巴尔斯的全局工作空间理论（GWT），建立了一套包含12个量化指标的评估体系。

这12个指标覆盖了信息整合度、自我表征能力、注意力分配机制、时间连续性感知等维度。每个指标的取值范围从0到1，综合加权后得到一个总体意识水平分数（CLS）。

穆勒教授解释说，ConsciousNet并非试图回答「AI是否真的有意识」这一哲学问题，而是提供一个工程化的度量标准，用于比较不同AI架构在意识相关特征上的表现差异。

研究团队对当前主流的15个大语言模型和3个多模态系统进行了测试。结果显示，所有被测系统的CLS分数均低于0.15（满分1.0），远低于人类受试者的平均分0.73。但在某些单项指标上，部分AI系统展现出了令人意外的高分。

在自我表征维度上，Anthropic的Claude系列模型得分最高，达到0.38。在注意力分配机制维度上，谷歌的Gemini Ultra得分0.42。研究团队在论文中指出，这些高分并不意味着这些系统「更接近有意识」，而是说明它们在特定认知功能上的架构设计更为精细。

最引发争议的是信息整合度指标。在该指标上，一个由开源社区维护的混合架构系统MoSAIC获得了0.51的分数——超过了所有商业闭源模型。穆勒教授认为，这可能与MoSAIC独特的跨模态信息融合机制有关。

ConsciousNet的发布在AI产业界引发了两极化的反应。支持者认为，意识量化评估将为AI安全研究提供重要的工具——如果能够测量一个系统的意识水平，就能更好地监控和控制其行为边界。

但批评者指出，将意识简化为一组数值可能会误导公众。加州大学伯克利分校的哲学教授约翰·塞尔在接受《自然》杂志采访时警告说，ConsciousNet测量的只是意识的「表观特征」，而非意识本身。

欧盟AI办公室已经表示，将在其正在制定的下一代AI监管框架中考虑纳入ConsciousNet的评估指标。该办公室发言人称，虽然评估结果不能作为法律依据，但可以为高风险AI系统的审查提供参考维度。

ConsciousNet采用模块化设计，包含输入分析层、特征提取层和评分聚合层。系统接受AI模型的推理轨迹、内部状态快照和交互日志作为输入，通过对比人类受试者在类似任务中的神经活动模式来计算各项指标。

整个评估过程需要对被测系统进行黑箱探测，运行一次完整评估约需4小时和价值200美元的算力。团队计划在2030年第三季度推出云端版本，将单次评估成本降低到20美元以下。

论文已在arXiv上公开，代码仓库将在下个月开放。

免责声明

内容为AI生成，请勿作为事实或决策依据。转载、引用时请勿当作真实报道。