人工智能(artificial intelligence; AI)系统能经由分析您看电视的习惯, 「神准」地推荐您可能会喜欢的电视节目, 这听起来已经够令人不寒而栗了, 现在, AI系统正接受更新的训练—— 挑选出人类行为与容貌中的细微线索, 使其在某些情况下比人类更具有直觉能力.
在一项实验中, AI被用于婚姻治疗中分析配偶的声音特征, 并预测治疗的结果. 根据这项实验显示, AI在预测治疗结果方面十分成功, 有时还比人类专家更准确.
在婚姻治疗中有两项变量使其难以评估是否取得进展. 每一对夫妇之间的关系动态都不相同, 治疗师的人为评估永远都是相当主观的. 因此, 该领域一直致力于发展出一些客观的指针.
美国南加州大学(University of Southern California; USC)的一项研究计划中, 研究人员试图开发的AI系统可望提供这一类的指针. 虽然目前已经有一项研究能将各种声音特征映像至情绪, 包括经常用于辨识的特征(如音调和强度), 以及分别组成音调和幅度的频率扰动度(jitter)与振幅扰动度(shimmer)等其它特征. 另一个是谐波噪声比(HNR).
为了评估这些特征并将其映像至情感, 以利于分析配偶之间的对话质量, 研究人员开发了一套复杂的算法. 正如研究人员在其论文「根据语音声学特微预测配偶治疗结果」(Predicting couple therapy outcomes based on speech acoustic features)中所解释的, 这些对话显示退缩或逃避的迹象吗? 这会增加逃避的严重性, 频率(坏)或减少(好)? 对话中存在幽默的迹象吗? 增加(好)还是减少(坏)? 哪些对话的特征更具有建设性? 哪些较少? 重要性如何?
该系统还考虑了这些对话的特征, 例如谁在说话? 在何时说话? 以及持续说了多少时间等等. 有趣的是, AI却忽略了对话的内容.
一旦研究人员对其AI系统进行训练后, 就可以将它套用在具有已知结果的现有数据集上. 另一方面, 研究人员也要求人类心理学家评估相同的数据, 包括说话内容以及语音特性等, 结果显示对于相同案例的正确预测率约75.6%. 而AI仅使用语音特性, 就达到79.3%的成功预测率.
研究人员表示, 研究结果有助于进一步鼓励其他有关测量非语言线索方面的研究, 从而协助这一类型的治疗.
例如, 美国史丹佛大学(Stanford University)的研究人员训练神经网络辨识35,000张以上的脸孔, 以确定它是否能仅透过外表特征辨别异性恋和同性恋者. 最后得到的结论也就成为其论文主题: 「深度神经网络比人类更能准确从脸部影像判别性取向」(Deep neural networks are more accurate than humans at detecting sexual orientation from facial images).
多年来, 同性恋和女同性恋的话题一直引发对于「同性恋雷达」(gaydar)方面的研究兴趣, 但在名称上却总是脱离不了直觉. 史丹佛大学的研究似乎类似于面相学和颅相学等「伪科学」, 因而使其论文更具争议性, 但其初步的研究结果也不容忽视.
作者指出其中一项研究显示, 当人们看到某个人的脸, 就能以更佳准确度辨认出这个人, 以及察觉其情感状态, 个人特质, 性取向与其他特质.
他们还提到「出生前激素理论」(prenatal hormone theory), 该理论为性取向提供了生理的基础(研究尚未作出结论). 他们在文章中提道: 「这与性取向的出生前激素理论一致, 男同性恋者和女同性恋者的脸孔往往具有非典型的性别特征, 表情和打扮风格. 」(但这并不表示所有的男同性恋比男异性恋更女性化, 也不是指没有男同性恋具有显著的男性面部特征, 女同性恋的情况也是如此. )
研究人员认为, 他们训练神经网络同时考虑固定的脸部特征(例如鼻子的形状)以及不固定的特征(打扮风格).
研究人员使用交友网站上那些将自己标示为异性恋或同性恋者的照片. 当提供两张不同脸部(一张异性恋和一张同性恋者)的照片给神经网络判读时, AI系统可正确猜测到男性的机率为81%, 猜测到女性的准确率为71%. 至于人类判读者的准确率分别落在61%与54%.
作者明确指出, 这项研究存在局限性, 很可能会导致危险的后果, 因此不要误解或者过度解读研究结果. 首先, 神经网络和人类判断之间的结果显示, 神经网络侦测到的脸部特征差异非常微妙, 人类很显然不会注意到这些特征.
编译: Susan Hong