looksmaxxing 是不是伪科学？把 PSL 评分这套智商税拆给你看

通常是凌晨两点开始的。一个人把一张正脸照传进某个 PSL 评分帖，得到一个数字——比如 4.5，「低端 normie」。换一个帖，又给他 5.2。同一张脸，同一束光，隔了十二个小时。到第三个工具，他已经不信任何一个了，转而全都信——这比谁都不信更糟。

你会读到这里，说明你也注意到裂缝了。分数对不上。建议越来越激进。而所有这一切底下，压着一个问题，论坛永远答不好：looksmaxxing 到底是建立在真的吸引力研究上，还是一套披着测量外衣的伪科学？

短答案：那个最朴素的直觉——「外形是有用的，而且有一部分能改」——是真的，也有扎实研究支撑。但搭在它上面的 PSL 评分系统不是。把这两件事分开，因为很多人就是栽在这条缝里。

关键数字

PSL 量表通常跑 0–8（有时 0–10），「normie」中位数大致钉在 5 附近——而这个 5，背后没有任何已发表研究当锚点。
整套框架主要看四个轴：harmony（协调）、dimorphism（两性二态）、angularity（棱角）、miscellaneous（杂项）——没有一个是拿「女性真实反应」校准过的。
一篇汇集 919 项研究、12,261 名评审者的 meta-analysis 发现：陌生人对「谁好看」高度一致——但测的是整体直觉打分，不是几何分轴评级（Langlois et al., 2000）。
吸引力判断大约在 100 毫秒内成形（Willis & Todorov, 2006）——是一个近乎瞬时的整体读取，不是各项子特征加总。
临床和主流媒体反复指出：青少年男生和年轻男性在发育期对「外形驱动的身体意象障碍」格外脆弱，而这类内容会把它放大。

先说清楚：PSL 自称在测什么

要判断一个东西是不是伪科学，得先认真对待它的主张。

PSL 这名字来自早年的 PUAHate / Sluthate / Lookism 论坛，是在那儿被定下来的。它把自己包装成比那种随口「打 1 到 10 分」更「客观」的替代品。按 looksmaxxing 攻略的说法，它把一张脸沿几个轴评分：harmony（五官搭得有多协调）、dimorphism（这张脸读起来有多明确的男性气质）、angularity（颧骨、下颌这类低体脂、棱角分明的特征），再加一堆 miscellaneous 杂项——皮肤、眉毛、鼻子。这些汇成一个数字和一个等级：底层 sub-normie，往上 true normie、chadlite、chad，再往上是各种梗等级。

单看表面，这套东西不算离谱。面部对称、性别二态、皮肤质量，在真实的吸引力文献里确实作为「女性打分会响应的因素」出现过——对称和二态在择偶偏好研究里都被研究得不少。论坛不是凭空捏的这些原料。问题不在原料，而在那个结论：它声称算出来的是你「价值」的一个固定、精确的成绩。

（一句 caveat：连「文献支持对称重要」这句本身，都比论坛说得软。效应是真的，但量级中等，且随人群浮动。这些都不是物理定律。）

为什么分数永远对不上——根上的毛病

把同一张照片喂进三个 PSL 工具，你会拿到三个数字。社区把这当成「需要平均掉的噪声」。它不是噪声。它是系统在告诉你：它根本没有 ground truth（基准真值）。

机制就一句话，整篇文章都在这一句里：**PSL 分数测的是一张静态照片的几何，它没在测你有多有吸引力。**这是两个不同的量——而这套框架悄悄拿一个偷换了另一个。

一张照片里编码着光线、镜头、头的倾角、相机高度、表情，以及一张运动中的脸被冻住的那一毫秒。把光从顶光挪到 45 度，下颌就「多」了棱角；把相机压到视线以下，二态就「变好」了。你一根骨头都没动，数字却整整动了一分。（同样的脆弱性我们在面部比例工具和第一印象窗口那篇里讲过——任何给单帧打分的系统，都继承了这套不稳定。）

再往深一层：**这些轴从来没拿真实吸引力数据校准过。**没有哪个 PSL 等级是这么定的——把脸拿给女性看、记录她们的反应、再反推出分界线。「normie = 5」这个锚不是来自任何数据集；它是一条论坛惯例，硬化成了一种「感觉」。社区其实半知道这事——你随便翻一个 looksmaxxing 论坛，都能看到用户骂 AI 颜值打分器是「cope」「不可靠」，没完没了地争一张脸「到底」是 6 还是 7。那个争论永远不会有结论，因为底下没有任何东西能用来裁决它。

所以「PSL 量表是真的还是伪科学」——精确答案是这样：它借来真的变量，挂上一个看起来很精确的数字，却从不去验证这个数字能不能预测它声称要预测的东西。一个无法对照现实检验的测量，不是测量，是一套词汇。

真正的吸引力研究发现了什么

光拆台不给真图，那只是犬儒。所以换个视角说。

当研究者正经地测吸引力时，结论几乎和 PSL 的运作方式相反。Langlois 和同事 2000 年那篇 meta-analysis 汇了 919 项研究、一万两千多名评审者，发现人们对「谁好看」相当一致，甚至跨文化也是。听起来像在给「客观评分」背书，其实恰好相反。那份一致出现在整体的、凭直觉的打分里——「给这张脸打 1 到 7」——而不是在任何人「把测出来的子特征加总」里。大脑不会去算 harmony 加 dimorphism 加 angularity。它就是直接反应。

有多快？Willis & Todorov（2006）把脸只闪 100 毫秒，那个瞬间判断和「不限时」做出的判断高度相关。十分之一秒——一个整体的知觉格式塔，不是一场几何考试。

而驱动这个格式塔的输入，比 PSL 承认的要宽得多。Buss 的 37 文化研究（1989，n ≈ 10,000）发现，女性会很重地权衡地位、可靠、温暖这类线索——不只是脸的形状。光环效应（Dion, Berscheid & Walster, 1972）意味着一张被读成好看的脸，会被额外记上它没被验证过的善良——而且这事会反向运行，温暖和自信会反过来掰弯别人对这张脸本身的读取。薄片研究（Ambady & Rosenthal, 1992）显示，人们能从几秒钟的行为里提取出相当准的判断——表情、动作、你怎么撑住自己这副身板。PSL 工具一样都看不见。它读的是一张冻住的像素网格。

这也是为什么我们的感知吸引力框架是围绕「女性真正会有的那个直觉反应」搭的，而不是一个几何成绩——也是为什么感知吸引力的行为是一条非线性阈值，不是一道平滑的加分阶梯。有那么一条带，你从「背景板」跨进「她会多看一眼」，而能不能进这条带，主要靠你能动的线索，不是你动不了的骨头。（想看正面版本，去女性真正觉得有吸引力的是什么。）

Caveat：关于吸引力的研究共识是真的，但它是统计层面的——一个偏好的分布，不是对你个人下的判决。那个平均值里面，住着大量个体差异，这恰恰和「固定等级」相反。

有一部分不只是错，是危险

PSL 这套范式不只是测错——在它的边缘，它会把人推向真实的伤害。

最清楚的例子是 bonesmashing：故意拿硬物砸自己的颧骨、下颌或下巴，想「逼」出更锋利的骨相。实践者引用 Wolff 定律——骨骼会在应力下重塑。医学专业人士直说这是误读：骨骼是在渐进、可控的负荷下重塑，不是在钝器冲击下。各家新闻报道里被引用的医生，对现实后果说得很直白——需要钢板螺钉的面部骨折、神经损伤、牙齿损伤、脑震荡。这个干预手段，会把它叫你「修好」的那个东西永久毁掉。

更安静的伤害是心理上的。临床工作者越来越多地把 looksmaxxing 文化和躯体变形障碍、肌肉变形障碍联系起来，尤其是青少年男生和年轻男性——随着这类内容塞满年轻男性的信息流，心理学和医学评论里普遍提出了这个担忧。那些打分排名帖本身，也经常变得有敌意，参与者会羞辱发帖的人，或拿他跟别的男人作贬低性的对比——这个循环，亲手制造出它声称要诊断的那种不满。最极端的那一支——「black pill」——告诉人们「你的脸是一张无期徒刑判决书」，临床工作者把这种信息直接和绝望、无望联系在一起。

下面这句，那些帖子里没人会告诉你，而它是这整篇里最重要的一句：**一个从未拿现实校准过的工具吐给你的低分，不是关于你未来的信息。**它是一台坏掉的仪器的读数。如果某个 PSL 分数让你觉得「判决已经下来了」，那么错的是分数，不是你。真正最能搬动「女性怎么读一个男人」的那些东西——体态体脂、整洁打理、衣服合不合身、姿态、表情、你散发出的社交信号——恰恰是 PSL 挥手当成「halo cope（光环自欺）」打发掉的，好腾出地方卖给你那些你改不了的部位。这是反的。那些能改的东西不是安慰奖，它就是那根杠杆。

Caveat，因为这事是认真的：如果对外形的担忧正在吃掉你一天里实打实的几个小时，或者某个数字把你的情绪带去了某个很暗的地方，去跟一个真人聊——朋友、医生、心理咨询师。没有任何网页工具，包括我们的，能替代这个。

那 mewing 呢？looksmaxxing 到底值不值、在约会里真有用吗？

看你指的是哪个「它」——而这两半指向相反的方向。

PSL 评分范式——那些等级、那套几何评级、追一个三个工具都对不上的数字——不管用，因为它根本没在测决定约会结果的东西。它催生出来的极端干预，从没用到危险都有。这一支不值得你花时间；其中有些部分值得你主动躲开。

至于 mewing（长期把舌头顶在上腭以「重塑」颌面）这类被反复神化的具体手法：成年人的骨相是不是真能靠这个被搬动，缺乏可靠证据支持，正经口腔颌面的共识也不站它那边。把它当作「成年后能改命的杠杆」，期望值要往下压。可改的东西很多，但通常不是这些。

但噪声底下那个无聊、正经的内核——把体脂降进一个偏精瘦的带、修好打理和皮肤、穿合身的衣服、站得像你没在为占了这点空间而道歉、在像样的光里拍照——确确实实能搬动「女性怎么感知你」，而且它是顺着研究走的，不是和研究对着干。这些没有一样需要等级系统。你需要的是一次诚实的读取：到底是什么在拖累你，哪些值得改。

那次读取，正是我们做这个测试的原因。它故意不给你 PSL 等级，也不给「10 分制打几分」，因为那个框架本身就是问题。它从「女性实际上怎么感知一个男人」出发——那条阈值、那个直觉反应、能搬动它的那些线索——告诉你哪一根能改的杠杆最在拖你后腿，以及每一根大致值多少。没有 black pill。不对你的骨头下判决。只给你那部分你能动手的——而这部分，结果是占了绝大多数。

想顺手看看 quiz 类头部词，可以从我帅吗自测进。

上文引用：Langlois, J. H., et al. (2000). Maxims or myths of beauty? A meta-analytic and theoretical review. Psychological Bulletin, 126(3), 390–423. Willis, J., & Todorov, A. (2006). First impressions: Making up your mind after a 100-ms exposure to a face. Psychological Science, 17(7), 592–598. Buss, D. M. (1989). Sex differences in human mate preferences. Behavioral and Brain Sciences, 12(1), 1–49. Dion, K., Berscheid, E., & Walster, E. (1972). What is beautiful is good. Journal of Personality and Social Psychology, 24(3), 285–290. Ambady, N., & Rosenthal, R. (1992). Thin slices of expressive behavior as predictors of interpersonal consequences. Psychological Bulletin, 111(2), 256–274.