应用科技

从机器学习看个人的运动及卫生习惯 – CASE 报科学

分享至

机器学习到底可以做到哪些事情呢?你绝对想不到,连「人类习惯」这个行为,都可以透过让机器学习来分析!过去我们对於习惯养成所需要的时间、因素完全没有定论,各派都有各自认定的时间。心理学家Buyalskaya等人透过连锁健身房後台的资料,以及医院PFID装置资料,利用机器学习的方式,分析人们「上健身房」、「洗手」行为的养成时间,以及影响的因素等,尝试破除大众对於「习惯养成」的迷思。

撰文|王冠云

来源:MotionElements

建立一个习惯到底需要多少时间呢?21天?40天?3个月?相信各位也看了不少坊间流传的各种神奇数字。一群心理学家们使用机器学习的方法,从大数据资料来分析人们去健身房运动以及在医院中洗手的习惯,他们发现,环境脉络的众多因子会影响到习惯养成的速度以及坚固度。

什麽是习惯?

心理学家或神经科学家们定义习惯是一种决策过程,这个过程让个体在相同的脉络之下,皆会有相同的行为,且不论结果为何,都会发生。而所谓的脉络,指的是环境中的感官刺激、地点、先前的行为等等。不过,习惯是一种渐进式养成的过程,所以在不同的人、环境线索以及行为当中,应该会存在不同的习惯养成的速度。

至於习惯究竟如何养成、速率为何、影响的脉络因子有哪些,就是Buyalskaya等人 (2023) 想透过机器学习及大数据来分析的课题。有监於过往研究较少关注於实验室以外真实人们的习惯养成数据,在他们的研究中,都使用了很大量的真实数据,共有两个子研究。子研究一收集了超过三万人的健身房参与资料(合计1200万笔观察资料);子研究二则收集了三千多人在医院中的卫生习惯资料(合计4000万笔观察资料)。

上健身房的习惯养成

有关健身房的出席次数,Buyalskaya等人 (2023) 收集了北美一家连锁健身房的後台资料,总共有横跨了14年,超过1200万笔的会员资料可供分析。资料包含了去健身房的时间、健身房的地点以及该健身房据点的设施资料。藉由这些资料,再进一步的推算出每一位会员每周上健身房的次数、入会时间等等资讯。

研究所使用的演算模型是LASSO回归(least abosolute shrinkage and selection operator,最小绝对值收敛和选择算式),特色在於它可以基於个人的各项行为指标,产生一个特定个人的数值,而且不需要预先设定统计假设。其所产生的个人数值,又称为个人行为的可预测性 (predictability),范围介於0.5到1之间,0.5代表完全随机,1则代表完全可预测。

模型计算的结果发现,所有个体的平均可预测度是0.806,大致可说是可预测的。在模型的设计上,每一个当日是否会进健身房运动的可能性,是由那个当日追溯的过往纪录来预测。在各个预测因子中,对模型而言最重要的因素是前一次去健身房的时间与当日的间隔。再者,还有是否为「星期一」或「星期四」,以及前7日去健身房的次数等等。而之所以会出现特定的星期,推测应该和个人的工作行程有关,所以即便只是星期一与否,也会影响到模型的预测。而每个个体对於健身房习惯的养成也有所差异,要形成去健身房的习惯大约需要68至77天。

另外,研究者也加入了酬赏条件的变化,例如好天气与坏天气因素是否会影响健身房的出席率。结果发现,若是高可预测性的健身房会员,对於酬赏的反应并不会产生特别的变化,也就是「酬赏贬值 (reward devaluation)」,即使有更好的酬赏来奖励他们去健身房,但固着的习惯使他们对於酬赏变化的反应敏感度不因此特别升高。

洗手的习惯养成

至於手部卫生的习惯资料,则是透过医院职员所配戴的RFID装置来进行资料统计。在Buyalskaya等人 (2023) 的研究中,取得了30间医院,超过5000名职员的在一年间的资料,总共有4000多万笔资料可供分析。

这个RFID装置会监测每一个在需要洗手的机会中,该职员是否有执行洗手的动作。收集用来提供给模型进行预测的变项中,包含时间点、医院名、房间地点等。与健身房的习惯预测相同,也是使用LASSO回归进行预测。

预测结果发现,对於模型而言最重要能预测该员是否洗手的预测因子是「顺从度 (compliance)」,即前一次洗手的时机点,是否依照医院的规定进行洗手。若是前一次有遵守医院规定,通常在当下的那一次,也理当会依照规定洗手。另外,其他重要的预测因子还包含上一次排班的时间、房间的进出(离开时洗手比进入时洗手的机率要大)等。

手部卫生的模型则是平均得到了0.788的预测值,也代表了医院职员的洗手习惯若干程度的可预测性。而洗手习惯的养成,大约经过9-10个班次,或是大约220次的洗手之後,就能预测下一次的洗手。这样的速率是比上健身房的习惯养成还要更快的。另外,酬赏方面,研究者假定离开医院应该会更能诱使职员们洗手,但实际发现却没有显着差异。

破除习惯养成的迷思

综上所述,Buyalskaya等人 (2023) 指出,在他们的调查中有三项重要的发现。第一,环境脉络的因素对於某些人而言,更能预测他们的习惯养成行为,而且透过LASSO模型,研究者们也试着分析出最能预测行为的因子;第二,和一般大众流行的说法不同,其实并没有习惯养成的「魔法天数」,毕竟上健身房的习惯和洗手习惯的养成时间大不相同;第三,对於习惯养成已经很定型的个体而言,他们对於酬赏的敏感度会降低,对於行为介入的反应会较弱。不论是在健身房还是在医院,对於已经养成的习惯,其实不会有太多的酬赏或奖励会改变固定的行为。不过,由於技术上的限制,Buyalskaya等人 (2023) 也提醒读者,还是有可能有其他影响习惯的因素是没有被观察到的,仍有待进一步的确认。


参考文献

  1. Buyalskaya, A., Ho, H., Milkman, K. L., Li, X., Duckworth, A. L., & Camerer, C. (2023). What can machine learning teach us about habit formation? Evidence from exercise and hygiene. Proceedings of the National Academy of Sciences, 120(17), e2216115120.
  2. TEJ台湾经济新报-LASSO回归模型
nord加速器怎么样