热度:4来源:http://www.mofangbiji.com 综上所述,若要构造一个向量空间,首先要找到一些变量构成一组“基”,而且这些变量之间,必须互相独立,才有构成“基”的资格。下面简单介绍一下“独立”与“相关系数”的概念。
【独立(又称线性无关):一个变量的取值与另一个变量无关,即二者的相关系数为 0。】

图 2-9 显示了在不同的相关系数下,两个变量的散点图。相关系数是 1.0 时,两个变量是“完全正相关”关系。相关系数介于 0 和 1 之间时,是“正相关”关系。相关系数是 0 时,是“独立”关系。
举例说明。成年人的“身高”与“体重”互为正相关,而成年人的“身高”与“年龄”是互相独立的。
在本书的 10 个变量中,我们用计算机统计验证了 8 个变量之间的相关系数满足独立性(“阶段变化、内外”两个含义特殊的变量除外,因此 N 个独立的变量是一种概括性的说法)。例如,“平均压力、平均速度”两个变量的相关系数为 0.01,二者近似于互相独立(一般认为低于 0.1 即可),详见第 6 章。
另外,在设计和选择变量时,我们已经考虑到独立性的条件。前 6 个变量所描述的范围互相隔离,避免重叠。比如,“稳定”变量描述的是一个线条的中间段;“过渡”变量描述的是两个线条之间的连接;“头尾”变量描述的是一个线条的起笔和收笔。未来,我们可能发现新的变量,它们既有明确心理含义,也与现有的变量互相独立,可以加入到构成坐标系的“基”当中,这有待研究者继续探索。
有笔迹学经验的读者会发现,笔迹触觉理论使用的变量(即笔迹线条的触觉特征),与一些传统笔迹分析法使用的变量不同。本书没有使用“结体、字阵、章法”特征,如字体尺寸、字体倾斜、字间距、行间距、行方向、页边留白等。不使用这些变量的原因是,这些变量很难满足独立性的条件。如果变量之间不互相独立,将导致在多变量间难以取舍,给结论带来两难选择,产生较大的偏差。
举例说明。我们实验测量“字体面积”与“平均速度”两个变量的相关系数为 0.77,如果将“字体面积”当作“字体尺寸”,一般而言,当字体尺寸较大时,平均速度较快。但也有一小部分可能性,当字体尺寸较大时,平均速度较慢。如果把这两个“正相关(不独立)”的变量作为坐标轴,会怎样呢?
某些笔迹学理论认为,“字体尺寸大”表示“开朗积极”的心理含义,“平均速度慢”表示“稳重含蓄”的心理含义。如果这两个特征在一份笔迹中同时出现,那么解释为前者还是后者呢?以哪个变量为主?以哪个变量为次?这会给结论判断造成很大困难。
再举一例说明。平面几何有两种常用的坐标系,分别是直角坐标系,如图 2-10(左),极坐标系,如图 2-10(中)。无论采用哪个坐标系,只要给定两个坐标值,都可以确定平面上的唯一点的位置。如图 2-10(左)的x=4,y=3 与图 2-10(中)的 ρ=5,θ=37°都表示同一个点 P。因为两个坐标轴的变量是互相独立的,即直角坐标系的横坐标 x 和纵坐标 y 互相独立,极坐标系的极径 ρ 和极角 θ 互相独立。

图 2-10 直角坐标系(左),极坐标系(中),不互相独立的坐标轴 x 和 ρ 组成坐标系(右)设想用“横坐标 x”和“极径 ρ”这两个互相“不独立”的变量作为坐标系的两个轴,来描述空间中一个点的位置,会怎样呢?在图 2-10(右)里,当 x=4,ρ=5 时,有两个点 P 和 Q 都满足条件,无法唯一确定点的位
置,出现了定位的混乱。
信息论告诉我们,在利用多种信息消除不确定时,所采用的信息是正交(垂直)的,效果最好。因此,本书选择了一组互相独立的变量作为“基”进行推理,才能得出没有歧义的结论。
另外,笔迹分析所用的变量不是越多越好。如果变量无限地增多,推理便没有边界,复杂度也无限地增加。
扫一扫 添加微信沟通
微信号:13338600012
电话:13338600012
QQ:2528049390
地址:签名笔迹商务服务中心