所谓多变量解析就是统计分析多个变量的数据后,明确变量间的关系,发现有效信息的手法的总称。
■什么是多变量解析?
在了解多变量解析前,有必要先了解一下什么是变量。例如下面是某个店铺制作的关于每个顾客购物情况数据的表格。购买频率、购买金额等项目中,由于顾客不同对应的数据也不同。在统计学中,值随着样本(这里指顾客)变化而变化的项目就叫做变量(或者叫变数)。所谓多变量解析,并不是把多个变量细分化,而是同时进行分析,然后得到有效的信息。
■多变量解析的特征
既然有多变量解析,当然也就有一个变量或是两个变量的解析。我们把变量是一个的叫做单变量解析或者一变量解析,把变量是两个的叫做二变量解析。用一变量解析和二变量解析,可以通过查频率分布和散布图得到一些信息。这些方法非常简单,也比较容易理解,但另一方面,因为变量太少,只能看到事物的一个或两个方面,所以得出的结果一般都没什么意义。例如上文所列举的顾客数据,如果一个一个变量地看,购买频率最高的是A,购买金额最高的是E。只能得到这样的数据。
多变量解析则可以同时分析多个变量之间的关系,这样,我们就可以知道某个变量对其他变量有什么影响。例如通过多变量解析我们有可能找出研究对象的选定和研究时机的选定之间存在的关系。运用多变量解析,专业的统计知识是必要的。以前,由于计算量庞大,要得到计算结果比较困难,但随着计算机的发展和多变量解析软件的改良,现在的企业和个人在运用多变量解析时已经容易多了。根据多变量解析的分析目的和变量的种类不同,有很多种处理方法,所得到的结果也不同。如果没有正确的知识就去运用这些方法,会导致意想不到的错误,甚至可能只得到一些错误的答案。因此,利用多变量解析,正确理解各种方法很重要。