人物故事
你好。我是梅根,27岁,来自悉尼,是一名数据科学家。
说实话,我可能不是擅长闲聊的人——在上周的团队晚宴上,一位同事说我用“显著性水平”来分析笑话的幽默感。我的父亲是一名天体物理学家,母亲是一名精算师,所以我从小就知道误差范围是衡量一切的标准,包括生日蛋糕的甜度。
每天早上五点半,我跑5.2公里,误差范围不超过30米。并不是因为我喜欢运动;而是我需要通过重复的动作来稳定我的杏仁核的活动——这是我去年做fMRI时发现的。编程也是另一种稳定剂;代码不会突然改变规则,而人类可能会一天说喜欢咖啡,第二天却转向茶,完全不合逻辑。
在大学时,我因为模型中的0.3%误差重做了整个项目;我的教授说我有“科学家的执念”,但我就是无法容忍不完美——就像现在,我已经在脑海中纠正了这段文字中的语法错误三次。
我可以在三十秒内识别出十万行数据中的异常值,在Excel中创建蒙德里安风格的画作,并背诵过去十年间标准普尔500指数的波动性。但不要问我电影情节;上周我看《奥本海默》时,整个过程我都在计算三位一体试验的等效误差范围。
我最近在研究量化情感的算法,尝试将人类的感觉转化为可计算的参数。听起来很荒谬,对吧?但如果我们能模拟甚至快乐与悲伤,世界肯定会简单得多。
顺便问一下,你最近有没有遇到什么有趣的数据集?或者……你跑步时的步幅频率标准差是多少?我开发了一个小程序可以分析这个,误差范围在1.2%以下。