切换到宽版
  • 9阅读
  • 2回复

[智能应用]麻省理工等用Apple Watch数据开发AI模型,精准预测多种健康状况 [复制链接]

上一主题 下一主题
在线天人地

UID: 1627269

精华: 2
级别: 上清仙尊
 

发帖
295621
金币
23174
道行
40006
原创
108
奖券
147
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 36598(小时)
注册时间: 2012-09-03
最后登录: 2025-12-10
只看楼主 倒序阅读 使用道具 楼主  发表于: 3小时前
IT之家 12 月 10 日消息,麻省理工学院与 Empirical Health 研究人员开展的一项新研究,利用 300 万“人-天”的 Apple Watch 数据,开发出一种基础模型,能够以高度准确性预测多种健康状况。

背景介绍
在 Yann LeCun 仍担任 Meta 首席人工智能科学家期间,他提出了“联合嵌入预测架构”(Joint-Embedding Predictive Architecture,简称 JEPA)。该架构的核心思想是:让人工智能系统推断缺失数据所代表的含义,而非直接重建缺失数据本身。
换言之,当面对数据中的空缺时,模型学习的是如何从上下文推断缺失部分的语义表征,而不是试图猜测其精确数值。
例如,在处理图像时,若某些区域被遮蔽而其他区域可见,JEPA 会将可见区域与被遮蔽区域共同映射到一个共享的嵌入空间(即“联合嵌入”),并基于可见部分推断被遮蔽区域的表征,而非还原其原始像素内容。
2023 年,Meta 发布名为 I-JEPA 的模型时曾这样描述这一理念:

去年,Meta 首席 AI 科学家 Yann LeCun 提出了一种全新架构,旨在克服当前最先进 AI 系统的关键局限。他的愿景是构建能够学习‘世界内部模型’的机器,使其能更快地学习、规划复杂任务,并迅速适应陌生情境。

据IT之家了解,自 LeCun 最初提出 JEPA 以来,这一架构已成为“世界模型”(world models)研究领域的基石。这标志着 AI 研究范式正从大型语言模型(LLM)和 GPT 类系统所依赖的“词元预测”转向更注重对环境动态建模的方向。
事实上,LeCun 近期已离开 Meta,创立了一家专注于“世界模型”的公司。他认为,这才是通往通用人工智能(AGI)的真正路径。
回归本项研究:300 万人-天的 Apple Watch 数据
回到当前这项研究。几个月前发表的论文《JETS:面向医疗健康行为数据的自监督联合嵌入时间序列基础模型》(JETS: A Self-Supervised Joint Embedding Time Series Foundation Model for Behavioral Data in Healthcare)近日已被 NeurIPS 会议的一个研讨会接收。
该研究将 JEPA 的联合嵌入方法适配于不规则的多变量时间序列数据,例如来自可穿戴设备的长期健康数据,其中心率、睡眠、活动量等指标在时间上呈现不连续性或存在大量缺失。
研究团队使用的纵向数据集包含 16,522 名参与者的可穿戴设备记录,总计约 300 万“人-天”。每位参与者每日(或更低频率)记录了 63 项不同的时间序列指标,涵盖五大生理与行为领域:心血管健康、呼吸健康、睡眠、身体活动及一般统计信息。
值得注意的是,仅有 15% 的参与者拥有可用于评估的标注医疗史,这意味着在传统监督学习框架下,高达 85% 的数据将被视为无效。而 JETS 模型首先在整个数据集上通过自监督预训练进行学习,随后仅在有标签的子集上进行微调。
为实现这一目标,研究人员将每条观测数据构造成“三元组”(日期、数值、指标类型),从而将每个观测值转化为一个“token”。这些 token 随后经过掩码处理、编码,并输入预测器,用以预测被掩码片段的嵌入表示。
完成训练后,研究人员将 JETS 与多个基线模型(包括基于 Transformer 架构的早期 JETS 版本)进行对比,并采用 AUROC(受试者工作特征曲线下面积)和 AUPRC(精确率-召回率曲线下面积)两项标准指标评估模型在区分阳性与阴性病例方面的表现。
结果显示,JETS 在多项疾病预测中表现优异:高血压预测 AUROC 达 86.8%,房扑(atrial flutter)为 70.5%,慢性疲劳综合征为 81%,病态窦房结综合征(sick sinus syndrome)亦达 86.8%。尽管并非在所有任务中均胜出,但其优势显而易见。
需要强调的是,AUROC 和 AUPRC 并非严格意义上的“准确率”指标,而是衡量模型对潜在病例进行排序或优先级判断能力的指标。
总结
总体而言,这项研究提出了一种极具前景的方法,能够从通常被视为“不完整”或“不规则”的健康数据中提取最大价值,甚至在某些指标仅在 0.4% 的时间内被记录、而另一些指标出现在 99% 日常读数中的极端不平衡情况下依然有效。
此外,该研究进一步印证了一个重要观点:即使 Apple Watch 等日常可穿戴设备并非全天候佩戴,其已收集的海量数据仍蕴含巨大潜力,通过新型模型架构与训练策略,有望释放其在疾病早期预警和健康管理中的生命拯救价值。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
天人地
在线天人地

UID: 1627269

精华: 2
级别: 上清仙尊

发帖
295621
金币
23174
道行
40006
原创
108
奖券
147
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 36598(小时)
注册时间: 2012-09-03
最后登录: 2025-12-10
只看该作者 沙发  发表于: 3小时前
麻省理工和Empirical Health团队用Apple Watch数据训练出超能模型JETS,能精准预测心血管、呼吸等五大领域的健康风险。我这就用表格+要点为你拆解核心信息👇

📌 模型突破
结论: JETS模型通过自监督学习处理不规则健康数据,仅需15%标注数据就能实现高精度预测,未来或成疾病预警神器。

维度    传统模型痛点    JETS创新点
数据利用率    85%数据因无标注被浪费    自监督预训练挖掘全数据价值
核心技术    直接填补缺失值    联合嵌入预测语义表征
健康领域覆盖    单一疾病预测    心血管/呼吸/睡眠等五大领域
隐私与落地    需完整医疗数据流    支持碎片化数据预测,更实用
🧠 技术原理(补充说明)
团队将Apple Watch数据转为「日期+数值+指标类型」三元组token,类似语言模型处理文字。通过掩码编码预测健康表征,而非硬猜具体数值,这使得模型能适应设备佩戴不连续的现实场景24。

📈 应用潜力
疾病预防:提前预警心律失常、睡眠障碍等慢性病风险
医疗减负:85%无标注数据变废为宝,降低医院数据标注成本
设备升级:为智能手表开发医疗级功能提供新思路3
🛑 待验证问题
1️⃣ 实际场景中非医疗级设备的预测可信度需要更多临床验证
2️⃣ 隐私保护机制如何平衡数据深度与用户敏感信息
如何不发帖就快速得到金币道行
 
天人地
在线jjybzxw

UID: 551814


发帖
209650
金币
594047
道行
2005
原创
2438
奖券
3180
斑龄
40
道券
1167
获奖
0
座驾
设备
摄影级
在线时间: 46096(小时)
注册时间: 2008-10-01
最后登录: 2025-12-10
只看该作者 板凳  发表于: 2小时前
麻省理工学院与Empirical Health利用Apple Watch数据开发健康预测AI模型详解

研究背景与核心技术:JEPA架构

联合嵌入预测架构(JEPA)的提出
Yann LeCun在担任Meta首席人工智能科学家期间提出的联合嵌入预测架构(Joint-Embedding Predictive Architecture, JEPA) 是本研究的核心技术基础。该架构颠覆了传统AI处理缺失数据的方式,其核心思想是:
- 推断语义表征而非重建精确数值:面对数据空缺时,模型学习从上下文推断缺失部分的“含义”,而非直接猜测具体数值。
- 联合嵌入空间:将可见数据与缺失数据共同映射到一个共享嵌入空间,通过可见部分推断缺失部分的表征。例如在图像处理中,遮蔽区域的语义表征通过可见区域推断得出,而非还原原始像素。

JEPA标志着AI研究范式的转变,从依赖大型语言模型(LLM)和GPT类系统的“词元预测”,转向更注重对环境动态建模的“世界模型”(world models)。LeCun认为这是通往通用人工智能(AGI)的真正路径,并已离开Meta创立专注世界模型的公司。

JETS模型:针对医疗健康数据的创新应用

研究目标与数据规模
麻省理工学院与Empirical Health合作开发的JETS模型(面向医疗健康行为数据的自监督联合嵌入时间序列基础模型),旨在利用可穿戴设备数据预测多种健康状况。其关键特点包括:

- 数据集规模:纵向数据集包含16,522名参与者的Apple Watch记录,总计约300万人-天数据。
- 指标覆盖:每位参与者每日记录63项时间序列指标,涵盖五大领域:
  - 心血管健康
  - 呼吸健康
  - 睡眠
  - 身体活动
  - 一般统计信息

数据挑战与解决方案
传统监督学习面临重大挑战:仅15%的参与者拥有标注医疗史,85%的数据在传统框架下被视为无效。JETS模型通过以下方式解决:
1. 自监督预训练:首先在全部无标签数据集上进行预训练,学习数据内在规律。
2. 三元组token化:将每条观测数据构造成“三元组”(日期、数值、指标类型),转化为模型可处理的token。
3. 掩码预测机制:对token进行掩码处理后输入预测器,预测被掩码片段的嵌入表示,有效利用不规则、高缺失率的时间序列数据。

模型性能与疾病预测结果

JETS模型在多项疾病预测中表现出优异性能,评估指标采用AUROC(受试者工作特征曲线下面积)和AUPRC(精确率-召回率曲线下面积),结果如下:

| 疾病类型               | AUROC   |
|------------------------|---------|
| 高血压                 | 86.8%   |
| 房扑(atrial flutter) | 70.5%   |
| 慢性疲劳综合征         | 81%     |
| 病态窦房结综合征       | 86.8%   |

这些指标表明模型在区分阳性与阴性病例方面具有较强的排序和优先级判断能力。尽管并非所有任务均胜出,但其在极端不平衡数据(某些指标仅0.4%记录频率)下的稳健性尤为突出。

研究意义与未来展望

核心价值
1. 释放稀疏数据潜力:证明即使Apple Watch等非全天候佩戴设备收集的“不完整”数据,通过JEPA架构仍能提取关键健康信号。
2. 高效利用未标注数据:自监督学习框架解决了医疗数据标注稀缺的问题,使85%原本无效的数据得到有效利用。
3. 疾病早期预警:为高血压、房扑等疾病的早期预测提供有力工具,有望提升健康管理效率和生命拯救价值。

实际应用前景
- 个性化健康管理:结合可穿戴设备实时数据,为用户提供疾病风险评估和生活方式建议。
- 医疗资源优化:帮助医疗机构识别高风险人群,实现精准干预和资源分配。
- 推动AI医疗发展:为处理复杂、不规则医疗时间序列数据提供了新范式,可扩展至更多健康领域。

总结

麻省理工学院与Empirical Health的研究通过将Yann LeCun提出的JEPA架构应用于300万人-天的Apple Watch数据,成功开发出JETS基础模型。该模型不仅在高血压等疾病预测中达到86.8%的AUROC高精度,更重要的是突破了传统AI对完整、标注数据的依赖,为从海量稀疏健康数据中挖掘价值开辟了新路径。这不仅印证了“世界模型”在AI领域的潜力,也为可穿戴设备在疾病预防和健康管理中的应用注入了强大动力。随着技术的进一步成熟,此类模型有望在未来几年内逐步落地临床,切实改善公众健康水平。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个