单调递增子序列(Longest-Monotonically-Sequence)

技术2022-05-11 122

单调子序列包含有单调递增子序列和递减子序列，不失一般性，这里只讨论单调递增子序列。首先，从定义上明确我们的问题。给定序列a₁, a₂, …, a_n，如果存在满足下列条件的子序列

a_i1<=a_i2<=…<=a_im, (其中i1<i2<…<im)

即称为一个原序列的长度为m的单调递增子序列，那么，现在的问题是我们要找出一个序列的最长的单调递增子序列。直观上来说，一个序列S_n，它有2ⁿ个子序列，枚举所有的子序列，找出其中单调递增的序列，然后返回其中最长的，这样我们的问题就解决了。当然，这个直观的算法在时间上为O(2ⁿ*n)，它的复杂度增长太快了，所以，我们还应该做得更好一些。于是，我们换个角度思考。假设我们对S_n排序（递增），得到S_n’。那么，S_n和S_n’的最长公共子序列C_m就是我们要求的最长单调递增子序列（如果你不清楚最长公共子序列的定义，just google it）。为什么？假设C_m’是S_n的最长单调子列，且C_m’!=C_m， C_m’的长度大于C_m。由于C_m’是递增的，并且C_m’的每一个元素都来自S_n，所以C_m’一定是S_n’的子列，而C_m’又是S_n的子列，所以C_m’是S_n和S_n’的公共子列，故C_m’的长度一定小于C_m，这与假设矛盾，所以C_m是最长单调子列。理论上我们的算法是正确的，复杂度方面，运用动态规划(dynamic programming)来求解LCS（最长公共子列，Longest-Common-Subsequence），时间上是O(n²)，空间上也是O(n²)。于是，对S_n排序需要nlogn的时间，而LCS需要n²，最后，我们的算法时间上是O(n²)。可以看到，通过上面的改进，我们的算法效率得到了很大的提升（从指数增长到多项式增长）。不过，程序设计的乐趣就是它会不断地给我们一些惊喜，所以，就此打住不是我们该做的，于是，更好的算法应该是存在的。对于序列S_n，考虑其长度为i的单调子列(1<=i<=m)，这样的子列可能有多个。我们选取这些子列的结尾元素（子列的最后一个元素）的最小值。用L_i表示。易知 L₁<=L₂<=…<=L_m 如果L_i>L_j(i<j)，那么去掉以L_j结尾的递增子序列的最后j-i个元素，得到一个长度为i的子序列，该序列的结尾元素a_k<=L_j<L_i，这与L_i标识了长度为i的递增子序列的最小结尾元素相矛盾，于是证明了上述结论。现在，我们来寻找S_n对应的L序列，如果我们找到的最大的L_i是L_m，那么m就是最大单调子列的长度。下面的方法可以用来维护L。从左至右扫描S_n，对于每一个a_i，它可能 (1) a_i<L₁，那么L₁=a_i (2) a_i>=L_m，那么L_m+1=a_i，m=m+1 (其中m是当前见到的最大的L下标) (3) L_s<=a_i<L_s+1，那么L_s+1=a_i 扫描完成后，我们也就得到了最长递增子序列的长度。从上述方法可知，对于每一个元素，我们需要对L进行查找操作，由于L有序，所以这个操作为logn，于是总的复杂度为O(nlogn)。优于开始O(n²)的算法。这里给出我的一个实现：（算法并没有返回具体的序列，只是返回长度） template <typename T> int LMS (const T * data, int size) { if (size <= 0) return 0; T * S = new T[size]; int S_Count = 1; S[0] = data[0]; for (int i = 1; i < size; i++) { const T & e = data[i]; int low = 0, high = S_Count - 1; while (low <= high) { int mid = (low + high) / 2; if (S[mid] == e) break; else if (S[mid] > e) { high = mid - 1; } else { low = mid + 1; } } //well, in this point //high is -1, indicating e is the smallest element. //otherwise, high indicates index of the largest element that is smaller than e if (high == S_Count - 1) S[S_Count++] = e; else S[high + 1] = e; } return S_Count;}

专利

最新回复(0)