일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- TRANSFORMER
- Cell-tissue
- FRFSR
- DIINN
- GNN
- TAAM
- implicit representation
- Zero-Shot sr
- Tissue segmentation
- ConvNeXt
- Reference-based SR
- CrossNet
- INR
- Referense Super Resoltuion
- Cell detection
- SISR
- Graph
- Super-Resolution
- hypergraph
- Cityscapes
- ADE20K
- GNN in image
- Reference Super-Resolution
- SegFormer
- LIIF
- graph neural network
- Feature reuse
- session-based recommendation
- arbitrary scale
- deep learning
- Today
- Total
목록딥러닝 논문 리뷰 (29)
딥러닝 분석가 가리

"Spatial-Frequency Mutual Learning for Face Super-Resolution" Abstract Face super-resolution (FSR)은 LR 얼굴 영상을 HR 얼굴 영상으로 복원하는것이 목표이다. Deep learning으로 FSR은 상당한 성취를 얻었지만 기존의 FSR 방법은 고정된 receptive field를 가지고 있으며 또한 facial 구조를 유지하기 힘들다는 단점이 있어 FSR의 성능을 제한시키고 있다. 이러한 문제점을 해결하기 위해, Fourier transform을 도입한다. Fourier transform은 global facial 구조 정보를 capture할 수 있고 image-size의 receptive field를 달성할 수 있다. Fou..

"CrossNet: An End-to-end Reference-based Super Resolution Network using Cross-scale Warping" Abstract Reference-based Super-Resolution (RefSR)은 High-resolution (HR) 참조 영상이 주어졌을때 low-resolution (LR)영상을 초해상화 하는것이다. 이때 Ref와 LR은 해상도 차이가 나는 유사한 관점의 영상이다. 기존의 RefSR 방법은 patch matching 및 두 개의 독립적으로 정의된 목적 함수를 가진 합성 pipeline과 같은 계단식 방식으로 장동해 패치간의 정렬 오류, grid 효과 그리고 비효율적인 최적화로 이어진다. 이러한 문제를 해결하기 위해 cross-..

"SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers" Abstract Transformer를 경량 MLP decoder와 통합하는 간단하고 효율적이지만 강력한 semantic segmentation framwork인 SegForemr를 제시한다. SegFormer는 두가지 특징이 있다. 1) SegFormer는 multiscale feature를 출력하는 새로운 계층적 구조인 Transformer encoder로 구성된다. 이것은 잠재적 encoding을 필요로 하지 않아, test 해상도가 훈련과 다를 때 성능 저하로 이어지는 positional code의 보간을 피할 수 있다. 2) SegFormer는 ..

"OCELOT: Overlapped Cell on Tissue Dataset for Histopathology" Abstract Whole-slide 영상에서 high-level 정보를 추출할 수 있는 Cell detection은 계산 병리학에서 근본적인 task이다. 정확한 cell detection을 위해, 병리학자는 종종 tissue-level 구조를 이해하기 위해 zoom-out하고 세포의 형태학과 주변 환경에 기반해 세포를 분류하기 위해 zoom-in 한다. 하지만, 주로 중복 영역이 있는 cell 이나 tissue 주석을 모두 포함하는 데이터 세트가 부족하기 때문에 cell detection 모델에 병리학자의 이러한 행동을 반영하기가 어렵다. 이러한 한계를 극복하기 위해, 조직 병리학에서 ce..

"The StarCraft Multi-Agent Challenge" Abstract 지난 몇 년동안 deep multi-agent reinforcement learning (RL)은 주목 받는 연구분야 이다. 이 분야에서 특히 어려운 문제는 부분적으로 관찰가능하고, 협력적인 multi-agent 학습이여야 한다. 에이전트 팀은 개인적인 관찰에만 의존하며 행동을 조정하는 방법을 배워야 한다. 이러한 문제는 많은 실제 시스템과 관련이 있고 일반-합 문제보다 평가하기 쉽기 때문에 매력적인 연구분야 이다. ALE나 MuJoCo 같은 표준 환경은 single-agent RL이 toy 영역을 넘어 grid world 같은 곳으로 이동하는것을 허락한다. 하지만, 협력적인 multi-agent RL에 비교할만한 ben..

"LDC: Lightweight Dense CNN for Edge Detection" Abstract Edge detection을 위해 Lightweight Dense Convolutional (LDC) 모델을 제안한다. 제안된 모델은 두가지 SotA 방법을 적용했지만, 이러한 접근 방식과 비교해 4% 미만의 parameter가 필요하다. 제안된 구조는 다른 lightweight model (less than 1M)가 비교했을때 얇은 edge map을 생송하고 높은 ODS 점수에 도달한다. 그리고 heavy model(less than 35M)과 비교했을때 비슷한 결과를 얻는다. 다른 sota 모델과 비교한 정성적, 정량적 결과를 제공한다. 제안된 LDC는 pre-trained weights를 사용하지 ..

"Omni Aggregation Networks for Lightweight Image Super-Resolution" Abstract 경령화 된 ViT frame work는 이미지 super-resolution(SR)에서 엄청난 발전을 이루었지만, uni-dimensional, 일차원의 self-attention 모델링 뿐만 아니라 homogeneous aggregation 방법은 effective receptive field(ERF)를 공간 및 채널 차원 모두에서 보다 포괄적인 상호작용을 포함하도록 제한한다. 이러한 단점을 해결하기위해 새로운 Omni-SR 구조에서 두가지 개선된 구성요소를 제안한다. 첫번째, Omni Self-Attention (OSA) block은 dense interaction ..

"Adversarial Text Image Super-Resolution Using Sinkhorn Distance" Abstract Convolutional nerual network 기반의 방법들은 SISR에서의 좋은 성능을 보인다는것을 증명했지만, text를 원본 처럼 나타내기에는 어려움이 있다. 그래서 본 논문에서는, supervision 방법인 Lp-norm을 사용하는것 대신에, 텍스트 이미지에서 의미있는 정보를 더 많이 보존 할 수 있는 새로운 방법을 제안한다. 새로운 방법은 적대적으로 학습된 feature 공간에서 정의된 Sinkhorn 거리와 기본 형태의 optimal transport를 결합한다. Sinkhorn 거리가 두 feature의 구성요소와 spatial locations 측명에..