[Introduction]
먼저 CNN이 성공할 수 있었던 많은 요인들 중 하나를 본다면 Convolution operator는 Image와 같은 grid에서 공간적인 특징을 추출하는 데에 있어 높은 성능을 보여주었던 점도 포함되겠죠.
하지만 Point cloud에서는 다릅니다. 왜냐하면 Point cloud는 irregular 하고 unordered 하기 때문에 이러한 Point cloud data에 바로 kernel을 적용시킨다는 것은 점의 순서를 다르게 하거나 형상정보를 버리는 꼴이 되니까요.
이러한 문제를 다루기 위해 본 논문에서는 학습 가능한 X-transformation을 제안합니다. 이를 통해 convolution은 point cloud의 공간 정보를 얻을 수 있고 unordered 한 point cloud를 canonical order로 만들 수 있게 됩니다.
[X-transformation]
X-transformation을 설명하기 위해 다음 4가지 data를 보겠습니다.

Figure 1은 (i) regular grid, (ii~iv) point cloud입니다. 각각의 data는 C-dimensional의 feature를 갖는 unodered set
그럼 (i)에 convolution연산을 하기 위해서는

그리고 (ii)~(iv) point cloud 각각에 convolution 연산을 한결과는 Figure 1a와 같습니다.
이때 (ii)와 (iii)의 결과를 보면 (ii)와 (iii)는 분명히 다른 위치의 점들 임에도 불구하고 같은 순서로 입력되었기 때문에 같은 convolution연산 결과를 얻게 됩니다.
반면 (iii)와 (iv)는 같은 위치의 점들 임에도 불구하고 다른 순서로 입력되어 다른 convolution연산 결과를 얻습니다.
결국 Point cloud에 직접 convolution연산을 하는 것은 data의 형상정보를 변형되게 하고 order에 민감한 결과를 초래할 수 있다는 것을 알 수 있습니다.
본 논문에서는 위와 같은 문제를 해결하기 위해 K개의 input points들의 좌표를

Figure 1a에 X-Conv를 적용한 결과는 Figure 1b가 됩니다. 이때
[Hierarchical Convolution]

Regular grid - Figure 2 위의 input은
PointCNN - Figure 2 아래의 input은
본 논문은 representation point를 random sampling을 통해 선택하였지만 추가 연구가 필요할 수 있다고 말합니다.
[X-Conv Operator]

Input은 다음과 같습니다.
1.

2.
(이때 만들어지는

3.
4.
5.
6. 마지막으로 Conv(
[PointCNN Architectures]

Figure 4a : 두번의 X-Conv layer를 통해 더 많은 특징정보를 담고 있는 representation point를 구합니다. receptive field는 K/N(K : neighboring point number, N : point number in the previous layer)의 비율로 감소합니다. 생성되는 하나의 representation point는 전체 point들의 global view와 형상이 shape의 의미를 위한 feature를 갖고 있습니다.
-> training sample이 빠르게 감소한다는 단점이 문제가 있다.
Figure 4b : network의 depth는 그대로 두고 receptive field만을 늘리고 싶어 grid-based CNN의 hollow convolution의 개념을 도입합니다. 그러면 receptive field를

grid-based CNN의 hollow convolution은 왼쪽의 이미지와 같이 동작하는 convolution 연산을 의미합니다.
Figure 4c : segmentation task를 위해선 high resolution point-wise output이 필요합니다. 그래서 본 논문에서는 U-net의 Conv-DeConv(정확히는 Transpose convolution) 구조를 사용합니다. 그럼 point단위로 segmentation을 진행할 수 있겠죠.