跳转至

单纯形法求解线性规划问题

线性规划的一般形式

在线性约束条件下,寻找目标函数 \(z\) 的最大值:

\[ \max \ z = x_1 + x_2 \]
\[ s.t \begin{cases} 2x_1 + x_2 \leq 12 \\ x_1 + 2x_2 \leq 9 \\ x_1, x_2 \geq 0 \end{cases} \]

线性规划的可行域

满足线性规划问题约束条件的所有点组成的集合就是线性规划的可行域。若可行域有界(以下主要考虑有界可行域),线性规划问题的目标函数最优解必然在可行域的顶点上达到最优。

单纯形法就是通过设置不同的基向量,经过矩阵的线性变换,求得基可行解(可行域顶点),并判断该解是否最优,否则继续设置另一组基向量,重复执行以上步骤,直到找到最优解。所以,单纯形法的求解过程是一个循环迭代的过程。

kexingyu

图 1 可行域

线性规划的标准形式

在说明单纯形法的原理之前,需要明白线性规划的标准形式。因为单纯形算法是通过线性规划的标准形来求解的。一般,规定线性规划的标准形式为:

\[ \max \ z = \sum_{j = 1}^{n}c_jx_j \]
\[ s.t \begin{cases} \displaystyle \sum_{j = 1}^{n}a_{ij}x_j = b_i, i = 1,2,\dots,m\\ x_j \geq 0 , j = 1,2,\dots,n \\ \end{cases} \]

写成矩阵形式:

\[ \max \ z = CX \]
\[ AX = b \]
\[ X \geq 0 \]
\[ A = \begin{bmatrix} a_{11} & a_{12} & \ldots & a_{1n}\\ a_{21} & a_{22} & \ldots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \ldots & a_{mn} \end{bmatrix} \]

标准形的形式为:

  • 目标函数要求 \(\max\)

  • 约束条件均为等式

  • 决策变量为非负约束

普通线性规划化为标准形:

  • 若目标函数为最小化,可以通过取负,求最大化
  • 约束不等式为小于等于不等式,可以在左端加入非负变量,转变为等式,比如:
\[ x_1 + 2x_2 \leq 9 \Rightarrow \begin{cases} x_1 + 2x_2 + x_3 = 9\\ x_3 \geq 0 \end{cases} \]

同理,约束不等式为大于等于不等式时,可以在左端减去一个非负松弛变量,变为等式。

  • 若存在取值无约束的变量,可转变为两个非负变量的差,比如:
\[ -\infty \leq x_k \leq +\infty \Rightarrow \begin{cases} x_k = x_m - x_n\\ x_m,x_n \geq 0 \end{cases} \]

本文最开始的线性规划问题转化为标准形为:

\[ \max \ z = x_1 + x_2 \]
\[ s.t \begin{cases} 2x_1 + x_2 + x_3 = 12 \\ x_1 + 2x_2 + x_4 = 9 \\ x_1, x_2, x_3, x_4 \geq 0 \end{cases} \]

单纯形法

几何意义

在标准形中,有 \(m\) 个约束条件(不包括非负约束),\(n\) 个决策变量,且 \(n \geq m\)。首先选取 \(m\) 个基变量 \(x_j^{'}(j = 1, 2, \ldots, m )\),基变量对应约束系数矩阵的列向量线性无关。通过矩阵的线性变换,基变量可由非基变量表示:

\[ x_i^{'} = C_i + \sum_{j = m + 1}^{n}m_{ij}x_j^{'}(i = 1, 2, \ldots , m) \]

如果令非基变量等于 \(0\),可求得基变量的值:

\[ x_i^{'} = C_i \]

如果为可行解的话,\(C_i\) 大于 \(0\)。那么它的几何意义是什么呢?

还是通过上述具体的线性规划问题来说明:

\[ \max \ z = x_1 + x_2 \]
\[ s.t \begin{cases} 2x_1 + x_2 + x_3 = 12 \\ x_1 + 2x_2 + x_4 = 9 \\ x_1, x_2, x_3, x_4 \geq 0 \end{cases} \]

如果选择 \(x_2\)\(x_3\) 为基变量,那么令 \(x_1\)\(x_4\) 等于 \(0\),可以去求解基变量 \(x_2\)\(x_3\) 的值。对系数矩阵做行变换,如下所示,\(x_2=\dfrac{9}{2}\)\(x_3=\dfrac{15}{2}\)

\[ \left[\begin{array}{cccccc}{\mathrm{X}} & {x_{1}} & {x_{2}} & {x_{3}} & {x_{4}} & {b} \\ {} & {2} & {1} & {1} & {0} & {12} \\ {} & {1} & {2} & {0} & {1} & {9} \\ {\mathrm{C}} & {1} & {1} & {0} & {0} & {z}\end{array}\right] \rightarrow\left[\begin{array}{cccccc}{\mathrm{X}} & {x_{1}} & {x_{2}} & {x_{3}} & {x_{4}} & {b} \\ {} & {\frac{3}{2}} & {0} & {1} & {-\frac{1}{2}} & {\frac{15}{2}} \\ {} & {\frac{1}{2}} & {1} & {0} & {\frac{1}{2}} & {\frac{9}{2}} \\ {\mathrm{C}} & {\frac{1}{2}} & {0} & {0} & {-\frac{1}{2}} & {z-\frac{9}{2}}\end{array}\right] \]

\(X_1=0\) 表示可行解在 \(y\) 轴上;\(X_4=0\) 表示可行解在 \(x_1+2x_2=9\) 的直线上。那么,求得的可行解即表示这两条直线的交点,也是可行域的顶点,如图所示:

kexingyu_point

图 2

所以,通过选择不同的基变量,可以获得不同的可行域的顶点。

如何判断最优

如前所述,基变量可由非基变量表示:

\[ x_i^{'} = C_i + \sum_{j = m + 1}^{n}m_{ij}x_j^{'}(i = 1, 2, \ldots , m) \]

目标函数 \(z\) 也可以完全由非基变量表示:

\[ z = z_0 + \sum_{j = m + 1}^{n} \sigma_j x_j^{'} \]

当达到最优解时,所有的 \(\sigma_j\) 应小于等于 \(0\),当存在 \(j\)\(\sigma_j > 0\) 时,当前解不是最优解,为什么?

当前的目标函数值为 \(z_0\),其中所有的非基变量值均取 \(0\)。由之前分析可知,\(x_j^{'} = 0\) 代表可行域的某个边界,是 \(x_j^{'}\) 的最小值。如果可行解逐步离开这个边界,\(x_j^{'}\) 会变大,因为 \(\sigma_j > 0\),显然目标函数的取值也会变大,所以当前解不是最优解。我们需要寻找新的基变量。

如何选择新的基变量

如果存在多个 \(\sigma_j > 0\),选择最大的 \(\sigma_j > 0\) 对应的变量作为基变量,这表示目标函数随着 \(x_j^{'}\) 的增加,增长的最快。

如何选择被替换的基变量

假如我们选择非基变量 \(x_s^{'}\) 作为下一轮的基变量,那么被替换基变量 \(x_j^{'}\) 在下一轮中作为非基变量,等于 \(0\)。选择 \(x_j^{'}\) 的原则:替换后应该尽量使 \(x_s^{'}\) 值最大(因为上面已分析过,目标函数会随着 \(x_s^{'}\) 的增大而增大),但要保证替换基变量后的解仍是可行解,因此应该选择最紧的限制。

继续通过上面的例子来说明:

\[ \left[\begin{array}{cccccc}{\mathrm{X}} & {x_{1}} & {x_{2}} & {x_{3}} & {x_{4}} & {b} \\ {} & {2} & {1} & {1} & {0} & {12} \\ {} & {1} & {2} & {0} & {1} & {9} \\ {\mathrm{C}} & {1} & {1} & {0} & {0} & {z}\end{array}\right] \rightarrow\left[\begin{array}{cccccc}{\mathrm{X}} & {x_{1}} & {x_{2}} & {x_{3}} & {x_{4}} & {b} \\ {} & {\frac{3}{2}} & {0} & {1} & {-\frac{1}{2}} & {\frac{15}{2}} \\ {} & {\frac{1}{2}} & {1} & {0} & {\frac{1}{2}} & {\frac{9}{2}} \\ {\mathrm{C}} & {\frac{1}{2}} & {0} & {0} & {-\frac{1}{2}} & {z-\frac{9}{2}}\end{array}\right] \]

从最后一行可以看到,\(x_1\) 的系数为 \(\dfrac{1}{2}>0\),所以选 \(x_2\)\(x_3\) 为基变量并没有是目标函数达到最优。下一轮选取 \(x_1\) 作为基变量,替换 \(x_2\)\(x_3\) 中的某个变量。

第一行是符号

第二行:若 \(x_1\) 替换 \(x_3\) 作为基变量,\(x_3=0\) 时,\(x_1=\dfrac{\dfrac{15}{2}}{\dfrac{3}{2}}=5\)

第三行:若 \(x_1\) 替换 \(x_2\) 作为基变量,\(x_2=0\) 时,\(x_1=\dfrac{\dfrac{9}{2}}{\dfrac{1}{2}}=9\)

尽管替换 \(x_2\) 后,\(x_1\) 的值更大,但将它代入 \(x_3\) 后会发现 \(x_3\) 的值为负,不满足约束。从几何的角度来看,选择 \(x_2\)\(x_4\) 作为非基变量,得到的解是直线 \(x_2=0\)\(x_1 + 2x_2 = 9\) 的交点,它在可行域外。因此应该选择 \(x_3\) 作为非基变量。

终止条件

当目标函数用非基变量的线性组合表示时,所有的系数均不大于 \(0\),则表示目标函数达到最优。

如果,有一个非基变量的系数为 \(0\),其他的均小于 \(0\),表示目标函数的最优解有无穷多个。这是因为目标函数的梯度与某一边界正交,在这个边界上,目标函数的取值均相等,且为最优。

使用单纯形法来求解线性规划,输入单纯形法的松弛形式,是一个大矩阵,第一行为目标函数的系数,且最后一个数字为当前轴值下的 \(z\) 值。下面每一行代表一个约束,数字代表系数每行最后一个数字代表 \(b\) 值。

算法和使用单纯性表求解线性规划相同。

对于线性规划问题:

\[ \max \ x_1 + 14x_2 + 6x_3 \]
\[ s.t \begin{cases} x_1 + x_2 + x_3 \leq 4 \\ x_1 \leq 2 \\ x_3 \leq 3 \\ 3x_2 + x_3 \leq 6 \\ x_1, x_2, x_3 \geq 0 \end{cases} \]

我们可以得到其松弛形式:

\[ \max \ x_1 + 14x_2 + 6x_3 \]
\[ s.t \begin{cases} x_1 + x_2 + x_3 + x_4 = 4 \\ x_1 + x_5 = 2 \\ x_3 + x_6 = 3 \\ 3x_2 + x_3 + x_7 = 6 \\ x_1, x_2, x_3, x_4, x_5, x_6, x_7 \geq 0 \end{cases} \]

我们可以构造单纯形表,其中最后一行打星的列为轴值。

\(x_1\) \(x_2\) \(x_3\) \(x_4\) \(x_5\) \(x_6\) \(x_7\) \(b\)
\(c_1=1\) \(c_2=14\) \(c_3=6\) \(c_4=0\) \(c_5=0\) \(c_6=0\) \(c_7=0\) \(-z=0\)
\(1\) \(1\) \(1\) \(1\) \(0\) \(0\) \(0\) \(4\)
\(1\) \(0\) \(0\) \(0\) \(1\) \(0\) \(0\) \(2\)
\(0\) \(0\) \(1\) \(0\) \(0\) \(1\) \(0\) \(3\)
\(0\) \(3\) \(1\) \(0\) \(0\) \(0\) \(1\) \(6\)
\(*\) \(*\) \(*\) \(*\)

在单纯形表中,我们发现非轴值的 \(x\) 上的系数大于零,因此可以通过增加这些个 \(x\) 的值,来使目标函数增加。我们可以贪心的选择最大的 \(c\),在上面的例子中我们选择 \(c_2\) 作为新的轴,加入轴集合中,那么谁该出轴呢?

其实我们由于每个 \(x\) 都大于零,对于 \(x_2\) 它的增加是有所限制的,如果 \(x_2\) 过大,由于其他的限制条件,就会使得其他的 \(x\) 小于零,于是我们应该让 \(x_2\) 一直增大,直到有一个其他的 \(x\) 刚好等于 \(0\) 为止,那么这个 \(x\) 就被换出轴。

我们可以发现,对于约束方程 \(1\),即第一行约束,\(x_2\) 最大可以为 \(4\)\(\dfrac{4}{1}\)),对于约束方程 \(4\)\(x_2\) 最大可以为 \(2\)\(\dfrac{6}{3}\)),因此 \(x_2\) 最大只能为他们之间最小的那个,这样才能保证每个 \(x\) 都大于零。因此使用第 \(4\) 行,来对各行进行高斯行变换,使得第二列第四行中的每个 \(x\) 都变成零,也包括 \(c_2\)。这样我们就完成了把 \(x_2\) 入轴,\(x_7\) 出轴的过程。变换后的单纯形表为:

\(x_1\) \(x_2\) \(x_3\) \(x_4\) \(x_5\) \(x_6\) \(x_7\) \(b\)
\(c_1=1\) \(c_2=0\) \(c_3=1.33\) \(c_4=0\) \(c_5=0\) \(c_6=0\) \(c_7=-4.67\) \(-z=-28\)
\(1\) \(0\) \(0.67\) \(1\) \(0\) \(0\) \(-0.33\) \(2\)
\(1\) \(0\) \(0\) \(0\) \(1\) \(0\) \(0\) \(2\)
\(0\) \(0\) \(1\) \(0\) \(0\) \(1\) \(0\) \(3\)
\(0\) \(1\) \(0.33\) \(0\) \(0\) \(0\) \(0.33\) \(2\)
\(*\) \(*\) \(*\) \(*\)

继续计算,我们得到:

\(x_1\) \(x_2\) \(x_3\) \(x_4\) \(x_5\) \(x_6\) \(x_7\) \(b\)
\(c_1=-1\) \(c_2=0\) \(c_3=0\) \(c_4=-2\) \(c_5=0\) \(c_6=0\) \(c_7=-4\) \(-z=-32\)
\(1.5\) \(0\) \(1\) \(1.5\) \(0\) \(0\) \(-0.5\) \(3\)
\(1\) \(0\) \(0\) \(0\) \(1\) \(0\) \(0\) \(2\)
\(-1.5\) \(0\) \(0\) \(-1.5\) \(0\) \(1\) \(0.5\) \(0\)
\(-0.5\) \(1\) \(0\) \(-0.5\) \(0\) \(0\) \(0.5\) \(1\)
\(*\) \(*\) \(*\) \(*\)

此时我们发现,所有非轴的 \(x\) 的系数全部小于零,即增大任何非轴的 \(x\) 值并不能使得目标函数最大,从而得到最优解 \(32\)

理论罗列

标准型

\(m+n\) 个约束 \(n\) 个变量用 \(x\) 向量表示,\(A\) 是一个 \(m\times n\) 的矩阵,\(c\) 是一个 \(n\) 的向量,\(b\) 是一个 \(m\) 的向量,最大化 \(cx\) 满足约束 \(Ax \leq b,x > 0\)

最大化 \(\sum_{j=1}^nc_jx_j\) 满足如下约束条件:

\[ \sum_{j = 1}^na_{ij}x_j \leq b_i,i = 1,2,\ldots,m \]
\[ x_j \geq 0,j = 1,2,\ldots,n \]

\(n\) 个变量,\(m+n\) 个约束,构造 \(m \times n\) 的矩阵 \(A\)\(m\) 维向量 \(b\)\(n\) 维向量 \(c\)

最大化 \(C^Tx\) 满足如下约束条件:

\[ Ax \leq b \]
\[ x \geq 0 \]

转换为标准型

若目标函数要求取最小值,那么可以对其取相反数变成取最大值。对于限制条件 \(f(x_1, x_2, \ldots ,x_n) = b\),可以用两个不等式 \(f(x_1, x_2, \ldots, x_n) \leq b,-f(x_1,x_2,\ldots,x_n) \leq -b\) 描述,对于限制条件 \(f(x_1,x_2,\ldots,x_n) \geq b\),可以用不等式 \(-f(x_1,x_2,\ldots,x_n) \leq -b\) 描述。对于无限制的变量 \(x\),可以将其拆为两个非负变量 \(x_0,x_1\),使得 \(x = x_0 - x_1\)

松弛型

基本变量 \(B\)\(|B|=m\),一个约束对应一个,表示松弛量,叫做松弛变量(基本变量)

非基变量 \(N\)\(|N|=n\)\(x_n + i = b_i - \sum a_{ij}x_j \geq 0\)

松弛变量 \(x_{n+i}\)

\[ \sum_{j = 1}^na_{ij}x_j \leq b_i \rightarrow x_{n + i} = b_i - \sum_{j = 1}^{n}a_{ij}x_j, x_{n+i} \geq 0 \]

等式左侧为基本变量,右侧为非基本变量。

变量

  • 替入变量 \(x_e\)(非基变量)
  • 替出变量 \(x_l\)(基本变量)

可行解

  • 基本解:所有非基变量设为 \(0\),基本变量为右侧的常数

  • 基本可行解:所有 \(b_i \geq 0\)

注:单纯形法的过程中 \(B\)\(N\) 不断交换,在 \(n\) 维空间中不断走,「相当于不等式上的高斯消元」。

转轴

选取一个非基本变量 \(x_e\) 为替入变量,基本变量 \(x_l\) 为替出变量,将其互换,为了防止循环,根据 Bland 规则,选择下标最小的变量。

Bland 规则 可以参看:最优化方法

初始化

在所有 \(b_i < 0\) 的约束中随机选一个作为 \(x_l\),再随机选一个 \(a_{le} < 0\) 作为 \(x_e\),然后 \(pivot(l,e)\)\(b_i\) 就变正了。

评论