대역폭이 충분하지 않거나 레이어 용량이 큰 경우 replication이 timeout 발생합니다. replicate execution log[ERROR] [/controller/replication/transfer/image/transfer.go:396]: failed to pushing the blob sha256:, size *****: Put "http://harbor-core:80/v2/*": context deadline exceeded (Client.Timeout exceeded while awaiting headers)[ERROR] [/controller/replication/transfer/image/transfer.go:195]: Put "http://harbor-core:80/v2/*"..
1. GolssaryTerragruntTerraform으로 작성된 IaC를 Orchcstation하기 위한 Tool.UnitTerragrunt로 관리되는 단일 인프라 인스턴스로 hcl파일이 여기에 해당보통 하나의 VPC, DB, Server 등을 상징Root hcl과 Child hcl로 구분되며, K8s 기준 hcl hierarchy는 다음과 같다.root.hcl(base.bcl)Cluster 전체에 대한 kubernetes.hclnamespace에 대한 hclCR 등 의존성이 필요한 모듈에 대한 hclStackUnit의 집합으로 종종 하나의 region, business unit, app environment를 상징Module여러 리소스를 포함하는 .tf파일의 집합으로 Stack 내 하위 디렉터리로 ..
Ceph 모니터링을 하면서 NTP 데몬을 timesyncd에서 chrony로 변경해주어도 MON_CLOCK_SKEW 알람이 발생하여 원인을 파악하기 위해 기록한 글입니다. Monitor의 역할Ceph mon은 Cluster Map을 유지Cluster map은 모든 mon, osd, mds의 위치를 결정합니다.csi를 사용하는 client는 osd 또는 mds로 read/write를 하기 전에 반드시 mon을 통해서 현재 cluster map의 정보를 얻어야 합니다.cluster map을 갱신한 client는 CRUSH 계산으로 object의 위치를 알아내어 osd로 직접 통신할 수 있습니다.Authentication과 Logging 제공합니다.Cluster의 모든 변화는 단일 Paxos 인스턴스에 쓰여지..
1. InfiniBand(IB) 란? AI 등을 서비스하는 HPC(High Performance Computing) 환경에서 Model이나 Checkpoint 등 TB 단위의 대용량 데이터 RDMA(Remote Dynamic Memory Access)를 위한 저지연 통신 표준입니다. RDMA란?일반적인 패킷 인입은 ring buffer > DMA > CPU > Kernel buffer > Userspace로 전달되며, 이 과정에서 IRQ로 CPU context change가 발생하여 memcpy()가 이루어집니다.RDMA의 경우 패킷이 CPU로 인입되지 않고 NIC 또는 HCA에서 offload처리되어 memory에 직접 쓰여집니다. (Zero copy)송신측의 HCA는 수신측의 가상 메모리 페이지와 물..