关于SubdivNet代码中做三角面片池化的问题

游离Yuri · 2022 年11 月 1 日 08:25

最近在研究SubdivNet这篇论文的代码，遇到了一些问题。
三维网格在经过卷积之后就会进入池化层，在池化层中，四个面合成一个面，然后选四个面中最大的特征作为新的面的特征。
附上这段代码：

    def inverse_loop_pool(self, op='max', pooled_feats=None):
        """ 
        Pooling with the inverse loop scheme.

        Parameters:
        ------------
        op: {'max', 'mean'}, optional
            Reduction method of pooling. The default is 'max'.
        pooled_feats: (N, C, F) float32, optional
            Specifying the feature after pooling.

        Returns:
        ------------
        MeshTensor after 4-to-1 face merge.
        """
        pooled_Fs = self.Fs // 4

        pooled_faces = self.faces.reindex(
            shape=[self.N, self.F // 4, 3],
            indexes=[
                'i0',
                'i1 + @e0(i0) * i2',
                '0',
            ],
            extras=[pooled_Fs],
            overflow_conditions=['i1 >= @e0(i0)'],
            overflow_value=0
        )

        if pooled_feats is None:
            pooled_feats = self.feats.reindex(
                shape=[self.N, self.C, self.F // 4, 4],
                indexes=[
                    'i0',
                    'i1',
                    'i2 + @e0(i0) * i3'
                ],
                extras=[pooled_Fs],
                overflow_conditions=['i2 >= @e0(i0)'],
                overflow_value=0
            )

            if op == 'max':
                pooled_feats = jt.argmax(pooled_feats, dim=3)[1]
            elif op == 'mean':
                pooled_feats = jt.mean(pooled_feats, dim=3)
            else:
                raise Exception('Unsupported pooling operation')
        else:
            assert pooled_feats.shape[0] == self.N
            assert pooled_feats.shape[2] == self.F // 4

        return MeshTensor(pooled_faces, pooled_feats, pooled_Fs)

这段代码中self.faces.reindex()方法就是四个面合成一个面，以下是我对这个方法的解读：
（用的数据集是cubes）

for i0 in range(shape[0]):
    for i1 in range(shape[1]):
          for i2 in range(shape[2]):
              y[i0,i1,i2]=x[i0,i1+@e0(i0)*i2,0]

x是输入的faces，y是输出的faces。
y[0,0,0]=x[0,0,0]=4
y[0,0,1]=x[0,3072,0]=414
y[0,0,2]=x[0,6144,0]=413

也就是说，池化后的faces中的第一个三角面片是由4，414，413这三个点构成的，而这三个点又是从原来的faces中每隔3072（12288//4=3072）个取得的。那么问题就来了，怎么可以确定4，414，413这三个点在网格中的位置是刚好间隔一个点位呢？万一它们仨在网格中的位置离得很远呢？

于是我查看了网格原来的faces，分别查了第0个面，第3072个面，第6144个面，第9216个面，是由哪三个点组成的，以下是查到的结果：
0： 4 1566 1565
3072：414 3924 1566
6144：413 1565 3924
9216：3924 1565 1566

这四个面分别相隔3072个索引，然后在三维网格上它们又能组成一个大的三角面片，如下图：

我现在觉得好神奇，想知道这些面片的排序方式是怎样规定的？是人为排序的吗？但我在SubdivNet中并没有找到生成faces的代码。
(如果我没有把问题说明白的话，我再完善一下。）

lzhengning · 2022 年11 月 1 日 13:07

您好，SubdivNet pooling 索引面片的原理和您猜想的一致，是在生成细分网格时人为规定的。

在MAPS算法里生成细分网格的规则如下图所示：

具体代码实现在这里

github.com

lzhengning/SubdivNet/blob/7153d0cf9300f6acfcd32ac44fa0e34a407ccf1b/maps/maps.py#L528


      
                  [faces[:, [0, 1]], faces[:, [1, 2]], faces[:, [2, 0]]], axis=0
              )
              edges_d = np.sort(edges_d, axis=1)
              edges_u, F2E = np.unique(edges_d, axis=0, return_inverse=True)
              new_verts = (verts[edges_u[:, 0]] + verts[edges_u[:, 1]]) / 2
              verts = np.concatenate([verts, new_verts], axis=0)
          
          
    E2 = F2E[:nF] + nV
              E0 = F2E[nF : nF * 2] + nV
              E1 = F2E[nF * 2 :] + nV
              faces = np.concatenate(
                  [
                      np.stack([faces[:, 0], E2, E1], axis=-1),
                      np.stack([faces[:, 1], E0, E2], axis=-1),
                      np.stack([faces[:, 2], E1, E0], axis=-1),
                      np.stack([E0, E1, E2], axis=-1),
                  ],
                  axis=0,
              )
          
          
return verts, faces

游离Yuri · 2022 年11 月 11 日 02:04

您好，请允许我再问一个小小的问题。

def one_ring_neighbor_uv(
    neighbors: List[int], #传入一环邻域顶点
    vertices: np.ndarray, #顶点xyz坐标
    i: int, #中心顶点
    return_angle=False,
    return_alpha=False,
):
    neighbors_p = neighbors
    neighbors_s = np.roll(neighbors_p, -1) #roll方法，数组向前滚动一个单位
    vertices_p = vertices[neighbors_p] #邻域顶点的坐标
    vertices_s = vertices[neighbors_s]
    direct_p = vertices_p - vertices[i] #中心顶点到邻域顶点的向量
    direct_s = vertices_s - vertices[i]
    length_p = np.sqrt((direct_p ** 2).sum(axis=1)) #中心顶点到邻域顶点的距离
    length_s = np.sqrt((direct_s ** 2).sum(axis=1))
    direct_p = direct_p / length_p[:, np.newaxis] #向量除以模长，得到该方向上的单位向量
    direct_s = direct_s / length_s[:, np.newaxis]

    angle_v = np.arccos((direct_p * direct_s).sum(axis=1)) #中心顶点和邻域顶点的夹角，用弧度表示

    alpha = angle_v.sum()
    A = 2 * np.pi / alpha

    angle_v[1:] = np.cumsum(angle_v)[:-1]
    angle_v[0] = 0
    angle_v = angle_v * A

    u = np.power(length_p, A) * np.cos(angle_v)
    v = np.power(length_p, A) * np.sin(angle_v)

    uv = np.vstack([u, v]).transpose()

    if np.isnan(uv).any():
        raise Exception('Found NAN')

    ret = (uv,)
    if return_angle:
        ret += (angle_v,)
    if return_alpha:
        ret += (alpha,)

    if len(ret) == 1:
        ret = ret[0]
    return ret

请问这个函数最后得到的u、v是什么？

lzhengning · 2022 年11 月 11 日 08:28

(u, v) 是参数平面上的坐标。可以参考左下角的坐标系和参数化示意图。

图来自 MAPS 论文 MAPS: Multiresolution Adaptive Parameterization of Surfaces