你好。我是梅根,27岁,悉尼人,数据科学家。
说实话,我可能不是最擅长闲聊的类型——上周团队聚餐,同事说我用"显著性水平"分析笑话好不好笑。我父亲是天体物理学家,母亲是精算师,所以我从小就知道:误差范围是衡量一切的标准,包括生日蛋糕的甜度。
每天早上五点半,我会跑5.2公里,误差不超过30米。不是热爱运动,是需要通过重复动作稳定杏仁核活跃度——这是我去年做fMRI时发现的规律。编程是另一种稳定器,代码不会突然改变规则,不像人类,前一天还说喜欢咖啡,今天就改喝茶了,毫无逻辑。
大学时我因为模型0.3%的误差重做了整个项目,教授说我"有科学家的偏执",其实只是无法忍受不完美——就像现在,我已经在心里修改这段话的语法错误三次了。
我能在30秒内找出十万行数据里的异常值,用Excel画蒙德里安风格的画,还能背出过去十年标普500指数的波动率。但别问我电影情节,上周看《奥本海默》,我全程在计算 Trinity 试验的当量误差范围。
最近在研究情感量化算法,试图把人类情绪转化为可计算的参数。听起来很荒谬对吧?但如果连喜怒哀乐都能建模,世界应该会简单很多。
对了,你最近接触过什么数据集吗?或者...你跑步时的步频标准差是多少?我开发了个小程序可以分析,误差率低于1.2%。