TypeScript 中的类型级加泰罗尼亚语函数



考虑JavaScript中的以下加泰罗尼亚语函数。

class Pair {
constructor(fst, snd) {
this.fst = fst;
this.snd = snd;
}
}
const catalan = (x, xs) => {
if (xs.length === 0) return [x];
const result = [];
for (let i = 0; i < xs.length; i++) {
const ys = catalan(x, xs.slice(0, i));
const zs = catalan(xs[i], xs.slice(i + 1));
for (const y of ys) for (const z of zs) result.push(new Pair(y, z));
}
return result;
};
const show = (x) => x instanceof Pair
? `(${show(x.fst)} <> ${show(x.snd)})`
: JSON.stringify(x);
const log = (x) => console.log(x);
catalan(1, []).map(show).forEach(log);
catalan(1, [2]).map(show).forEach(log);
catalan(1, [2, 3]).map(show).forEach(log);
catalan(1, [2, 3, 4]).map(show).forEach(log);

它返回关联二元运算符n应用程序的所有可能方法,其中n = xs.length.

我想做类似的事情,但使用TypeScript中的类型。但是,我不知道如何实现"else"分支。

class Pair<A, B> {
constructor(public fst: A, public snd: B) {}
}
type Catalan<X, XS extends unknown[]> = XS extends []
? X
: /* how to define this “else” branch? */;
type C0 = Catalan<1, []>; // 1
type C1 = Catalan<1, [2]>; // Pair<1, 2>
type C2 = Catalan<1, [2, 3]>; // Pair<1, Pair<2, 3>> | Pair<Pair<1, 2>, 3>
type C3 = Catalan<1, [2, 3, 4]>; /* Pair<1, Pair<2, Pair<3, 4>>> |
* Pair<1, Pair<Pair<2, 3>, 4>> |
* Pair<Pair<1, 2>, Pair<3, 4>> |
* Pair<Pair<1, Pair<2, 3>>, 4> |
* Pair<Pair<Pair<1, 2>, 3>, 4>
* /

任何帮助将不胜感激。顺便说一下,我想使用此Catalan类型来定义以下函数。

declare const flatten: <X, XS extends unknown[]>(
x: Catalan<X, XS>
) => [X, ...XS];

以下是 JavaScript 中flatten函数的实现方式。

class Pair {
constructor(fst, snd) {
this.fst = fst;
this.snd = snd;
}
}
const catalan = (x, xs) => {
if (xs.length === 0) return [x];
const result = [];
for (let i = 0; i < xs.length; i++) {
const ys = catalan(x, xs.slice(0, i));
const zs = catalan(xs[i], xs.slice(i + 1));
for (const y of ys) for (const z of zs) result.push(new Pair(y, z));
}
return result;
};
const flatten = (x) => x instanceof Pair
? [...flatten(x.fst), ...flatten(x.snd)]
: [x];
const log = (x) => console.log(JSON.stringify(x));
catalan(1, []).map(flatten).forEach(log);
catalan(1, [2]).map(flatten).forEach(log);
catalan(1, [2, 3]).map(flatten).forEach(log);
catalan(1, [2, 3, 4]).map(flatten).forEach(log);


编辑:如果有帮助,这里是 Haskell 中值级catalan函数的实现。

import Data.List (inits, tails)
data Catalan a = Catalan a :<>: Catalan a | Lift a deriving Show
split :: [a] -> [([a], [a])]
split = init . (zipWith (,) <$> inits <*> tails)
catalan :: a -> [a] -> [Catalan a]
catalan x [] = [Lift x]
catalan x xs = do
(ys, z:zs) <- split xs
y <- catalan x ys
z <- catalan z zs
return $ y :<>: z
main :: IO ()
main = do
mapM_ print $ catalan 1 []
mapM_ print $ catalan 1 [2]
mapM_ print $ catalan 1 [2, 3]
mapM_ print $ catalan 1 [2, 3, 4]

这是上述Haskell程序的输出。

Lift 1
Lift 1 :<>: Lift 2
Lift 1 :<>: (Lift 2 :<>: Lift 3)
(Lift 1 :<>: Lift 2) :<>: Lift 3
Lift 1 :<>: (Lift 2 :<>: (Lift 3 :<>: Lift 4))
Lift 1 :<>: ((Lift 2 :<>: Lift 3) :<>: Lift 4)
(Lift 1 :<>: Lift 2) :<>: (Lift 3 :<>: Lift 4)
(Lift 1 :<>: (Lift 2 :<>: Lift 3)) :<>: Lift 4
((Lift 1 :<>: Lift 2) :<>: Lift 3) :<>: Lift 4

5 月 19 日更新

哦,天哪,我们还没有完成。我们可以让这件事变得更快!

您可以做的第一件事是将Catalan中的扩展转换为仅:

type Catalan<X, XS extends List> = ({
"0": X;
"1": Pair<X, XS[0]>;
} & {
[_: `${number}`]: CatalanLoop<X, XS>;
})[`${XS["length"]}`];

这使得它非常快。它现在只是一个查找表。

然后,我们可以使用分发条件类型,而不是CatalanLoop的大笨重循环!

type CatalanLoop<X, XS extends List, K extends keyof XS & `${bigint}` = keyof XS & `${bigint}`> =
K extends K
? Partition<XS, K> extends infer P
? P extends [List, List]
? P extends P
? CatalanPairs<X, XS, P, K>
: never
: never
: never
: never

您会注意到一种有助于分发的新类型:

type CatalanPairs<X, XS extends List, P extends [List, List], K extends keyof XS> = K extends K ? Pair<Catalan<X, P[0]>, Catalan<XS[K], P[1]>> : never;

试试这个新的游乐场,看看这些变化的影响。


遇到此类类型级问题时,最好查看原始代码并查找模式,或者类型系统可以为您执行的任何操作。

所以让我们开始:

const catalan = (x, xs) => {
if (xs.length === 0) return [x];
const result = [];
for (let i = 0; i < xs.length; i++) {
const ys = catalan(x, xs.slice(0, i));
const zs = catalan(xs[i], xs.slice(i + 1));
for (const y of ys) for (const z of zs) result.push(new Pair(y, z));
}
return result;
};

首先我们注意到,如果xs为空,则直接返回x。我们在心里记下以后使用XS["length"] extends 0 ? X : ...

然后我们看到:

const ys = catalan(x, xs.slice(0, i));
const zs = catalan(xs[i], xs.slice(i + 1));

实际上只是以这样的方式对xs进行分区:

partition [1, 2, 3, 4, 5] at 3 => [1, 2, 3] [5]

换句话说,我们在索引 3 处拆分元组并返回两半。这将比单独切片元组两次要快得多,并且可以毫不费力地实现。

最后,我们注意到这个嵌套循环:

for (const y of ys) for (const z of zs) result.push(new Pair(y, z));

在类型系统中不需要这样做,我们可以简单地做:

Pair<YS, ZS>

并让它从工会中为我们生成所有可能的对。

好了,是时候破解解决方案了。

回想一下,如果xs为空,则返回x

type Catalan<X, XS extends ReadonlyArray<unknown>> = 
XS["length"] extends 0 ? X : 

而且当XS只是一个元素时,我们返回该对。如果XS有多个元素,我们进入循环:

... : XS["length"] extends 1 ? Pair<X, XS[0]> : CatalanLoop<X, XS>;

现在让我们看看循环:

type CatalanLoop<X, XS extends ReadonlyArray<unknown>> = {
[K in keyof XS & `${bigint}`]: ...
}[keyof XS & `${bigint}`];

现在,这个看起来很有趣的东西是什么:

keyof XS & `${bigint}`

keyof XS会以number | "0" | "1" | "2" | "at" | "concat" | "..."的形式给我们一些东西,但我们只想要XS的索引。如果我们keyof XS与插值bigint相交,我们只得到所需的"0" | "1" | "2"

这意味着这就像原始代码中的循环一样!我们使用映射类型遍历每个索引。

在循环体中,我们在索引K处划分XS

type CatalanLoop<X, XS extends ReadonlyArray<unknown>> = {
[K in keyof XS & `${bigint}`]:
Partition<XS, K> extends [infer Left, infer Right]
? ...
: ...
}[keyof XS & `${bigint}`];

但是我们必须向 TypeScript 断言,我们的分区类型肯定会首先给我们这样的元组:

Partition<XS, K> extends [infer Left, infer Right]
? Left extends ReadonlyArray<unknown>
? Right extends ReadonlyArray<unknown>

然后我们打电话给Catalan并制作我们的配对:

? Catalan<X, Left> extends infer YS
? Catalan<XS[K], Right> extends infer ZS 
? Pair<YS, ZS>

这是在做这个原始代码所做的:

const ys = catalan(x, xs.slice(0, i));
const zs = catalan(xs[i], xs.slice(i + 1));
for (const y of ys) for (const z of zs) result.push(new Pair(y, z));

让我们用never关闭我们所有的三元/条件(因为这些子句无论如何都不应该达到):

: never
: never
: never
: never
: never

最后,我们需要制作我们的分区类型。

为此,我们需要一个类型来递增一个数字。这可以通过这样的元组来完成:

type Increment = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33];
Increment[0]  // => 1
Increment[15] // => 16
Increment[32] // => 33

现在我们可以递增一个数字,我们定义Partition

type Partition<
XS extends ReadonlyArray<unknown>,
At extends string,
Index extends number = 0,
Left extends ReadonlyArray<unknown> = [],
> = XS extends [infer First, ...infer Rest]
? `${Index}` extends At
? [Left, Rest]
: Partition<Rest, At, Increment[Index], [...Left, First]>
: never

此类型遍历XS,直到它到达At,即要分区的索引。它排除了At处的元素并停止,给我们[Left, Rest],两半。Partition是替换xs.slice(0, i)xs.slice(i + 1)的类型。

最后,仅针对踢球,让我们也制作一个类型来模仿原始show函数:

type Show<Pairs> = Pairs extends Pair<infer A, infer B> ? `(${Show<A>} <> ${Show<B>})` : `${Pairs & number}`;

哇!它确实有效!

type ShowFifth = Show<Catalan<1, [2, 3, 4, 5]>>;
// =>
// | "(1 <> (2 <> (3 <> (4 <> 5))))"
// | "(1 <> (2 <> ((3 <> 4) <> 5)))"
// | "(1 <> ((2 <> 3) <> (4 <> 5)))"
// | "(1 <> ((2 <> (3 <> 4)) <> 5))"
// | "(1 <> (((2 <> 3) <> 4) <> 5))"
// | "((1 <> 2) <> (3 <> (4 <> 5)))"
// | "((1 <> 2) <> ((3 <> 4) <> 5))"
// | "((1 <> (2 <> 3)) <> (4 <> 5))"
// | "((1 <> (2 <> (3 <> 4))) <> 5)"
// | "((1 <> ((2 <> 3) <> 4)) <> 5)"
// | "(((1 <> 2) <> 3) <> (4 <> 5))"
// | "(((1 <> 2) <> (3 <> 4)) <> 5)"
// | "(((1 <> (2 <> 3)) <> 4) <> 5)"
// | "((((1 <> 2) <> 3) <> 4) <> 5)"

为了结束这个小冒险,一个游乐场,你可以自己玩这个。

所以我的尝试是:

首先,我不确定我是否正确理解了加泰罗尼亚语算法。我纯粹通过查看您给出的示例来创建此类型。您需要测试这是否也适用于较大的元组。

解释

我使用了一些实用程序来解决这个问题。我需要一个类型来splice数组,所以我使用了这里的类型Splice

type Absolute<T extends string | number | bigint> = T extends string
? T extends `-${infer R}`
? R
: T
: Absolute<`${T}`>;
type isNegative<T extends number> = `${T}` extends `-${infer _}` ? true : false;
type SliceLeft<
Arr extends any[],
Index extends number,
Tail extends any[] = []
> = Tail["length"] extends Index
? [Tail, Arr]
: Arr extends [infer Head, ...infer Rest]
? SliceLeft<Rest, Index, [...Tail, Head]>
: [Tail, []];
type SliceRight<
Arr extends any[],
Index extends string,
Tail extends any[] = []
> = `${Tail["length"]}` extends Index
? [Arr, Tail]
: unknown extends Arr[0]
? [[], Tail]
: Arr extends [...infer Rest, infer Last]
? SliceRight<Rest, Index, [Last, ...Tail]>
: [[], Tail];
type SliceIndex<
Arr extends any[],
Index extends number
> = isNegative<Index> extends false
? SliceLeft<Arr, Index>
: SliceRight<Arr, Absolute<Index>>;
type Slice<
Arr extends any[],
Start extends number = 0,
End extends number = Arr["length"]
> = SliceIndex<SliceIndex<Arr, End>[0], SliceIndex<Arr, Start>[0]["length"]>[1];

我还需要一种方法来将keyof X(字符串)产生的数组的 indize 转换回数字。我使用了这个帮助程序类型:

type Indizes = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20]

现在来看算法本身。

我不清楚为什么XXS需要分开。第一步,我采用XXS并将它们合并到一个数组中。

type Catalan<X, XS extends unknown[]> = _Catalan<[X, ...XS]>

为了评估结果,我创建了一个递归类型_Catalan,它需要一个元组。前两个步骤很简单。如果元组length1,则返回数组内的元素。如果它是length2,则返回前两个元素的Pair

X["length"] extends 1 
? X[0]
: X["length"] extends 2 
? Pair<X[0], X[1]>
: /* ... */

其余的有点复杂。我的方法是在每个可能的索引处"剪切"数组一次,并使用两个生成的子数组递归调用_Catalan

[ 1 , 2 , 3 , 4 ]
|                <- first cut here
[ 1 ] [ 2 , 3 , 4 ]
|          <- next cut here
[ 1 ] [ 2 ] [ 3 , 4 ]
=> Pair<1, Pair<2, Pair<3,4>>

因此,在最高级别,我遍历每个元素并将所有迭代转换为带有[keyof X & '${bigint}']的并集。

{
[I in keyof X & `${bigint}`]: /* ... */
}[keyof X & `${bigint}`]

然后,我将索引转换为相应的数字,并且跳过第一次迭代,因为我们只需要将数组切割n - 1次。

I extends keyof Indizes 
? Indizes[I] extends 0
? never
: /* ... */
: never

最后,我使用Slice创建两个子数组,并通过调用_Catalan来创建两个子数组的Pair

Pair<_Catalan<Slice<X, 0, Indizes[I]>>, _Catalan<Slice<X, Indizes[I], X["length"]>>>

结果

最终结果如下所示:

type _Catalan<X extends unknown[]> = X["length"] extends 1 
? X[0]
: X["length"] extends 2 
? Pair<X[0], X[1]>
: {
[I in keyof X & `${bigint}`]: I extends keyof Indizes 
? Indizes[I] extends 0
? never
: Indizes[I] extends number 
? Pair<_Catalan<Slice<X, 0, Indizes[I]>>, _Catalan<Slice<X, Indizes[I], X["length"]>>>
: never
: never
}[keyof X & `${bigint}`]
type Catalan<X, XS extends unknown[]> = _Catalan<[X, ...XS]>

用法:

class Pair<A, B> {
constructor(public fst: A, public snd: B) {}
}
type _Catalan<X extends unknown[]> = X["length"] extends 1 
? X[0]
: X["length"] extends 2 
? Pair<X[0], X[1]>
: {
[I in keyof X & `${bigint}`]: I extends keyof Indizes 
? Indizes[I] extends 0
? never
: Indizes[I] extends number 
? Pair<_Catalan<Slice<X, 0, Indizes[I]>>, _Catalan<Slice<X, Indizes[I], X["length"]>>>
: never
: never
}[keyof X & `${bigint}`]
type Catalan<X, XS extends unknown[]> = _Catalan<[X, ...XS]>
type C0 = Catalan<1, []>; // 1
type C1 = Catalan<1, [2]>; // Pair<1, 2>
type C2 = Catalan<1, [2, 3]>; // Pair<1, Pair<2, 3>> | Pair<Pair<1, 2>, 3>
type C3 = Catalan<1, [2, 3, 4]>; /* Pair<1, Pair<2, Pair<3, 4>>> |
* Pair<1, Pair<Pair<2, 3>, 4>> |
* Pair<Pair<1, 2>, Pair<3, 4>> |
* Pair<Pair<1, Pair<2, 3>>, 4> |
* Pair<Pair<Pair<1, 2>, 3>, 4>
*/

如果将鼠标悬停在类型C3上,您会注意到它看起来与您指定的不同。只有3个顶级工会,每个成员在Pair内都有工会。

Pair<1, Pair<2, Pair<3, 4>> | Pair<Pair<2, 3>, 4>>
//instead of 
Pair<1, Pair<2, Pair<3, 4>>> | Pair<1, Pair<Pair<2, 3>, 4>>

但这纯粹是视觉上的事情,它们在功能上不应该有所不同。

一些验证结果的测试:

type Test1 = Pair<1, Pair<2, Pair<3, 4>>> extends C3 ? true : false
type Test2 = Pair<1, Pair<Pair<2, 3>, 4>> extends C3 ? true : false
type Test3 = Pair<Pair<1, 2>, Pair<3, 4>> extends C3 ? true : false
type Test4 = Pair<Pair<1, Pair<2, 3>>, 4> extends C3 ? true : false
type Test5 = Pair<Pair<Pair<1, 2>, 3>, 4> extends C3 ? true : false

操场

最新更新