looksmaxxing 是不是伪科学?把 PSL 评分这套智商税拆给你看
looksmaxxing 是不是伪科学、PSL 评分玄学是不是智商税、bonesmashing 危不危险、mewing 有没有用——一次讲清楚,哪些是真研究,哪些只是套了测量外壳的话术。
通常是凌晨两点开始的。一个人把一张正脸照传进某个 PSL 评分帖,得到一个数字——比如 4.5,「低端 normie」。换一个帖,又给他 5.2。同一张脸,同一束光,隔了十二个小时。到第三个工具,他已经不信任何一个了,转而全都信——这比谁都不信更糟。
你会读到这里,说明你也注意到裂缝了。分数对不上。建议越来越激进。而所有这一切底下,压着一个问题,论坛永远答不好:looksmaxxing 到底是建立在真的吸引力研究上,还是一套披着测量外衣的伪科学?
短答案:那个最朴素的直觉——「外形是有用的,而且有一部分能改」——是真的,也有扎实研究支撑。但搭在它上面的 PSL 评分系统不是。把这两件事分开,因为很多人就是栽在这条缝里。
关键数字
- PSL 量表通常跑 0–8(有时 0–10),「normie」中位数大致钉在 5 附近——而这个 5,背后没有任何已发表研究当锚点。
- 整套框架主要看四个轴:harmony(协调)、dimorphism(两性二态)、angularity(棱角)、miscellaneous(杂项)——没有一个是拿「女性真实反应」校准过的。
- 一篇汇集 919 项研究、12,261 名评审者的 meta-analysis 发现:陌生人对「谁好看」高度一致——但测的是整体直觉打分,不是几何分轴评级(Langlois et al., 2000)。
- 吸引力判断大约在 100 毫秒内成形(Willis & Todorov, 2006)——是一个近乎瞬时的整体读取,不是各项子特征加总。
- 临床和主流媒体反复指出:青少年男生和年轻男性在发育期对「外形驱动的身体意象障碍」格外脆弱,而这类内容会把它放大。
先说清楚:PSL 自称在测什么
要判断一个东西是不是伪科学,得先认真对待它的主张。
PSL 这名字来自早年的 PUAHate / Sluthate / Lookism 论坛,是在那儿被定下来的。它把自己包装成比那种随口「打 1 到 10 分」更「客观」的替代品。按 looksmaxxing 攻略的说法,它把一张脸沿几个轴评分:harmony(五官搭得有多协调)、dimorphism(这张脸读起来有多明确的男性气质)、angularity(颧骨、下颌这类低体脂、棱角分明的特征),再加一堆 miscellaneous 杂项——皮肤、眉毛、鼻子。这些汇成一个数字和一个等级:底层 sub-normie,往上 true normie、chadlite、chad,再往上是各种梗等级。
单看表面,这套东西不算离谱。面部对称、性别二态、皮肤质量,在真实的吸引力文献里确实作为「女性打分会响应的因素」出现过——对称和二态在择偶偏好研究里都被研究得不少。论坛不是凭空捏的这些原料。问题不在原料,而在那个结论:它声称算出来的是你「价值」的一个固定、精确的成绩。
(一句 caveat:连「文献支持对称重要」这句本身,都比论坛说得软。效应是真的,但量级中等,且随人群浮动。这些都不是物理定律。)
为什么分数永远对不上——根上的毛病
把同一张照片喂进三个 PSL 工具,你会拿到三个数字。社区把这当成「需要平均掉的噪声」。它不是噪声。它是系统在告诉你:它根本没有 ground truth(基准真值)。
机制就一句话,整篇文章都在这一句里:**PSL 分数测的是一张静态照片的几何,它没在测你有多有吸引力。**这是两个不同的量——而这套框架悄悄拿一个偷换了另一个。
一张照片里编码着光线、镜头、头的倾角、相机高度、表情,以及一张运动中的脸被冻住的那一毫秒。把光从顶光挪到 45 度,下颌就「多」了棱角;把相机压到视线以下,二态就「变好」了。你一根骨头都没动,数字却整整动了一分。(同样的脆弱性我们在面部比例工具和第一印象窗口那篇里讲过——任何给单帧打分的系统,都继承了这套不稳定。)
再往深一层:**这些轴从来没拿真实吸引力数据校准过。**没有哪个 PSL 等级是这么定的——把脸拿给女性看、记录她们的反应、再反推出分界线。「normie = 5」这个锚不是来自任何数据集;它是一条论坛惯例,硬化成了一种「感觉」。社区其实半知道这事——你随便翻一个 looksmaxxing 论坛,都能看到用户骂 AI 颜值打分器是「cope」「不可靠」,没完没了地争一张脸「到底」是 6 还是 7。那个争论永远不会有结论,因为底下没有任何东西能用来裁决它。
所以「PSL 量表是真的还是伪科学」——精确答案是这样:它借来真的变量,挂上一个看起来很精确的数字,却从不去验证这个数字能不能预测它声称要预测的东西。一个无法对照现实检验的测量,不是测量,是一套词汇。
真正的吸引力研究发现了什么
光拆台不给真图,那只是犬儒。所以换个视角说。
当研究者正经地测吸引力时,结论几乎和 PSL 的运作方式相反。Langlois 和同事 2000 年那篇 meta-analysis 汇了 919 项研究、一万两千多名评审者,发现人们对「谁好看」相当一致,甚至跨文化也是。听起来像在给「客观评分」背书,其实恰好相反。那份一致出现在整体的、凭直觉的打分里——「给这张脸打 1 到 7」——而不是在任何人「把测出来的子特征加总」里。大脑不会去算 harmony 加 dimorphism 加 angularity。它就是直接反应。
有多快?Willis & Todorov(2006)把脸只闪 100 毫秒,那个瞬间判断和「不限时」做出的判断高度相关。十分之一秒——一个整体的知觉格式塔,不是一场几何考试。
而驱动这个格式塔的输入,比 PSL 承认的要宽得多。Buss 的 37 文化研究(1989,n ≈ 10,000)发现,女性会很重地权衡地位、可靠、温暖这类线索——不只是脸的形状。光环效应(Dion, Berscheid & Walster, 1972)意味着一张被读成好看的脸,会被额外记上它没被验证过的善良——而且这事会反向运行,温暖和自信会反过来掰弯别人对这张脸本身的读取。薄片研究(Ambady & Rosenthal, 1992)显示,人们能从几秒钟的行为里提取出相当准的判断——表情、动作、你怎么撑住自己这副身板。PSL 工具一样都看不见。它读的是一张冻住的像素网格。
这也是为什么我们的感知吸引力框架是围绕「女性真正会有的那个直觉反应」搭的,而不是一个几何成绩——也是为什么感知吸引力的行为是一条非线性阈值,不是一道平滑的加分阶梯。有那么一条带,你从「背景板」跨进「她会多看一眼」,而能不能进这条带,主要靠你能动的线索,不是你动不了的骨头。(想看正面版本,去女性真正觉得有吸引力的是什么。)
Caveat:关于吸引力的研究共识是真的,但它是统计层面的——一个偏好的分布,不是对你个人下的判决。那个平均值里面,住着大量个体差异,这恰恰和「固定等级」相反。
有一部分不只是错,是危险
PSL 这套范式不只是测错——在它的边缘,它会把人推向真实的伤害。
最清楚的例子是 bonesmashing:故意拿硬物砸自己的颧骨、下颌或下巴,想「逼」出更锋利的骨相。实践者引用 Wolff 定律——骨骼会在应力下重塑。医学专业人士直说这是误读:骨骼是在渐进、可控的负荷下重塑,不是在钝器冲击下。各家新闻报道里被引用的医生,对现实后果说得很直白——需要钢板螺钉的面部骨折、神经损伤、牙齿损伤、脑震荡。这个干预手段,会把它叫你「修好」的那个东西永久毁掉。
更安静的伤害是心理上的。临床工作者越来越多地把 looksmaxxing 文化和躯体变形障碍、肌肉变形障碍联系起来,尤其是青少年男生和年轻男性——随着这类内容塞满年轻男性的信息流,心理学和医学评论里普遍提出了这个担忧。那些打分排名帖本身,也经常变得有敌意,参与者会羞辱发帖的人,或拿他跟别的男人作贬低性的对比——这个循环,亲手制造出它声称要诊断的那种不满。最极端的那一支——「black pill」——告诉人们「你的脸是一张无期徒刑判决书」,临床工作者把这种信息直接和绝望、无望联系在一起。
下面这句,那些帖子里没人会告诉你,而它是这整篇里最重要的一句:**一个从未拿现实校准过的工具吐给你的低分,不是关于你未来的信息。**它是一台坏掉的仪器的读数。如果某个 PSL 分数让你觉得「判决已经下来了」,那么错的是分数,不是你。真正最能搬动「女性怎么读一个男人」的那些东西——体态体脂、整洁打理、衣服合不合身、姿态、表情、你散发出的社交信号——恰恰是 PSL 挥手当成「halo cope(光环自欺)」打发掉的,好腾出地方卖给你那些你改不了的部位。这是反的。那些能改的东西不是安慰奖,它就是那根杠杆。
Caveat,因为这事是认真的:如果对外形的担忧正在吃掉你一天里实打实的几个小时,或者某个数字把你的情绪带去了某个很暗的地方,去跟一个真人聊——朋友、医生、心理咨询师。没有任何网页工具,包括我们的,能替代这个。
那 mewing 呢?looksmaxxing 到底值不值、在约会里真有用吗?
看你指的是哪个「它」——而这两半指向相反的方向。
PSL 评分范式——那些等级、那套几何评级、追一个三个工具都对不上的数字——不管用,因为它根本没在测决定约会结果的东西。它催生出来的极端干预,从没用到危险都有。这一支不值得你花时间;其中有些部分值得你主动躲开。
至于 mewing(长期把舌头顶在上腭以「重塑」颌面)这类被反复神化的具体手法:成年人的骨相是不是真能靠这个被搬动,缺乏可靠证据支持,正经口腔颌面的共识也不站它那边。把它当作「成年后能改命的杠杆」,期望值要往下压。可改的东西很多,但通常不是这些。
但噪声底下那个无聊、正经的内核——把体脂降进一个偏精瘦的带、修好打理和皮肤、穿合身的衣服、站得像你没在为占了这点空间而道歉、在像样的光里拍照——确确实实能搬动「女性怎么感知你」,而且它是顺着研究走的,不是和研究对着干。这些没有一样需要等级系统。你需要的是一次诚实的读取:到底是什么在拖累你,哪些值得改。
那次读取,正是我们做这个测试的原因。它故意不给你 PSL 等级,也不给「10 分制打几分」,因为那个框架本身就是问题。它从「女性实际上怎么感知一个男人」出发——那条阈值、那个直觉反应、能搬动它的那些线索——告诉你哪一根能改的杠杆最在拖你后腿,以及每一根大致值多少。没有 black pill。不对你的骨头下判决。只给你那部分你能动手的——而这部分,结果是占了绝大多数。
想顺手看看 quiz 类头部词,可以从我帅吗自测进。
上文引用:Langlois, J. H., et al. (2000). Maxims or myths of beauty? A meta-analytic and theoretical review. Psychological Bulletin, 126(3), 390–423. Willis, J., & Todorov, A. (2006). First impressions: Making up your mind after a 100-ms exposure to a face. Psychological Science, 17(7), 592–598. Buss, D. M. (1989). Sex differences in human mate preferences. Behavioral and Brain Sciences, 12(1), 1–49. Dion, K., Berscheid, E., & Walster, E. (1972). What is beautiful is good. Journal of Personality and Social Psychology, 24(3), 285–290. Ambady, N., & Rosenthal, R. (1992). Thin slices of expressive behavior as predictors of interpersonal consequences. Psychological Bulletin, 111(2), 256–274.
