System Engineering

System Engineering/Kubernetes

Kubelet MCE Memory Error - EDAC

운용중인 시스템에 'Handling MCE Memory Error'라는 문구와 함께 여러 에러가 발생했습니다. 결론적으로 하드웨어 문제는 아니었지만 찾아본 내용을 정리한 내용입니다. * MCE = Machine Check Error EDAC(Error Detection and Corredtion)EDAC는 CPU Cache, Memory, GPU, PCI bus 등과 같은 하드웨어의 에러를 감지하고 가능하다면 이를 수정하기 위한 커널 모듈입니다.아래는 커널 문서를 정리한 내용입니다. /Documentation/driver-api/edac.rst/Documentation/admin-guide/ras.rstCPU가 Memory Controller(이하 MC)로 데이터를 쓸 때, MC는 실시간으로 Hammin..

System Engineering/Linux

[커널이야기] 리눅스 I/O 스케쥴러

드디어 어려워서 계속 미뤄왔던 남은 마지막 챕터를 정리하네요. 이 포스팅은 아래 책을 정리하며 공부한 내용입니다. 좋은 책을 출판해주신 저자님께 감사드립니다 😊http://www.yes24.com/Product/Goods/44376723 DevOps와 SE를 위한 리눅스 커널 이야기 - 예스24커널은 오랜 세월 기능이 추가되고 개선되어 오면서 완벽하게 이해하기 힘들 정도로 방대해졌다. 하지만 변하지 않는 기본 기능들이 있다. 이런 근간이 되는 기능에 대한 이해를 바탕으로 시스www.yes24.com 목차- I/O 스케줄러의 필요성과 역할- I/O 스케줄러와 파라미터 튜닝  1) Non-Multiqueue 스케줄러    > CFQ    > Deadline    > Noop - Miltiqueue의 배경 ..

System Engineering/Network

Cloud를 위한 VXLAN part.1 - LAN 통신

Legacy network와 VXLAN을 공부하면서 기록한 내용을 정리해봅니다. 짧은 식견이라 오류가 있을 수 있습니다. 지적해주시면 감사드리겠습니다 😊 VXLAN의 본론에 앞서 실무하면서 잊어버렸던 Network 기초부터 기록한 뒤 part.2,3에서 VXLAN을 정리할 예정입니다. Part.1 - LAN 통신 Network와 3 Table (Routing, ARP, MAC) VXLAN을 사용하는 이유 1 - STP(Spanning Tree Protocol)와 Broadcasting storm VXLAN을 사용하는 이유 2 - MAC/ARP table으 한계 VXLAN을 사용하는 이유 3 - VLAN의 한계와 확장성 Part.2 - VXLAN VXLAN 용어 정리 VXLAN의 동작 방식 (VM-to-V..

System Engineering/Linux

[커널이야기] TCP Keepalive와 Retransmission

이전 내용(TCP handshake와 TIME_WAIT 소켓)에 이어 작성합니다. 목차 - TCP keepalive - Keepalive와 좀비 커넥션 - TCP keepalive vs HTTP keepalive - Keepalive와 Load Balancer - keepalive로 해결 가능한 문제 - TCP Retransmission과 RTO - 재전송과 커널 파라미터 그리고 tcp_write_timeout() 함수 - RTO_MIN 변경하기 - TCP 재전송과 Application Timeout 1. TCP keepalive keepalive란 한 번 맺은 세션의 요청이 끝나더라도 타이머에 따라 아주 작은 사이즈의 패킷을 보내어 연결을 유지해주는 기능입니다. 클라이언트의 잦은 요청으로 세션을 맺고 ..

Hopulence
'System Engineering' 카테고리의 글 목록