일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- #kubernetes
- k8s-driver-plugin
- k8s
- 얼굴분류
- kubectl #
- kubectl completion bash
- BigSur
- Pods Evicted
- RunContainerError
- mac m1
- Kotlin
- Kubernets 이론
- nvidia-driver-plugin
- macm1
- kubernetes자동완성
- kotin
- face verification
- 넘무무서웡...
- k8s-device-plugin
- ₩
- 얼굴검출
- nvidia-docker
- 삶이란...
- nvidia-container-cli
- GPU
- kubernetes
- 코틀린
- #Kuberspawner
- k8s고장나면
- worker node
- Today
- Total
목록전체 글 (27)
더듬이
1. Docker mysql image 가져오기 아래 명령어 입력시 간단히 msyql docker 이미지를 가져올 수 있다. 기본적으로 docker pull image_name:tag 의 형태로 사용하면 된다. docker pull mysql docker pull mysql:5.7 하지만 m1의 경우 아래와 같은 메시지가 뜰 것이다. m1 노트북을 사용하는 경우에는 아래와 같은 명령어를 통해서 image를 받아오기로하자. docker run --rm --platform linux/amd64 -it mysql:5.7 맨 밑에 erorr 는 무시하도록하자 사실 위 명령어는 mysql:5.7 이미지를 받아오는 것 뿐아니라 실행시키는 작업까지 포함인데 난 이미지 로드하는데만 사용하겠다.. 이게시글은 m1 아닌사..
일단 기본적으로 docker와 nvidia-driver가 설치되었다는 전제하에 설정을 진행하겠다. 1. worker-node에 nvidia-docker2를 설치 공식 사이트에 따라 아래 명령어들을 실행해보자 curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \ sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \ sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-..
실제로 gpu 노드를 gpu가 필요없는 pods 를 생성할때 사용 못하는 것은 너무나 비효율 적인것 같다. 실제로 https://github.com/NVIDIA/k8s-device-plugin 문서에 보면 아래와 같이 나와있습니다. apiVersion: v1 kind: Pod metadata: name: gpu-pod spec: containers: - name: cuda-container image: nvcr.io/nvidia/cuda:9.0-devel resources: limits: nvidia.com/gpu: 2 # requesting 2 GPUs - name: digits-container image: nvcr.io/nvidia/digits:20.12-tensorflow-py3 resources..
상황 설명 master node는 얌전한데 gpu카드가 있는 worker node가 고장난 상황이였다. reaboot 한 이후에 gpu pods에 대한 생성,삭제 기능이 pending 걸리는 현상이 발생되었다. 자세히 확인해보니 nvidia-device-plugin pods에 RunContainerError 가 발생하였고 아래와 같은 로그를 확인할 수 있었다. Error: failed to start container "nvidia-device-plugin-ctr": Error response from daemon: OCI runtime create failed: container_linux.go:349: starting container process caused "process_linux.go:449..
오늘부터 한강씩 보려구한다. 1강은 짧고 별내용없어서 행복하게 봤다~ https://www.edwith.org/ai251 단어 정리 - Scalar : 숫자 - Voctor : 순서가정해진l list 각 순서가 차원된다. 순서가 없는 경우 set - matrix : two-dimensional array 행렬연산에서의 anotation A_ij : i = row, j = column A_i, : i row의 백터 전체를 지칭 A_,i : i collumn의 백터 한줄을ㄹ 지칭 C = A + B = C_ij = A_ij + B_ij Ca ,cA : 각요소에 스칼라 곱 C = AB : C_ji = sigma_k A_j,k B_k,j 행렬연산에서의 properties AB != BA A(B+C) = AB +A..
TCP 와 UDP는 IOS 7계층에서 전송계층에서 사용하는 프로토콜이다. 간단한 개념 복기 전송계층: 네트워크 계층과 세션 계층 사이에서 송수신되는 데이터를 안전하게 전달해주는 계층 프로토콜: 위의 전송계층에서 송수신되는 데이터(패킷)을 서로 이해할 수 있는 표현방식으로 바꾸는 표현방식들을 말한다. 이렇게 전송계층의 프로토콜중 대표적인 것이 두가지 있는데 바로 TCP 와 UDP 이다. TCP 와 UDP 차이 연결성/ 신뢰성 /속도 차이 둘의 가장 큰 차이는 TCP 는 연결형 프로토콜 (Connection-oriented protocol)이고 UDP 는 비연결 지향형 프로토콜(Connection-less protocol) 이다. TCP는 연결이 먼저 성공해야 데이터 송수신이 가능하며 데이터의 손실,오류,삭..
상황 설명 Message: The node was low on resource: ephemeral-storage. Container notebook was using 1704Ki, which exceeds its request of 0. 어느날 갑자기 kubernetes api 가 안되서 kubectl get pods -A를 해보니 아래와 같은 container 상태를 확인할 수 있었다. kube-system metrics-server-8bbd5674f-224lj 0/1 Evicted 0 17d kube-system metrics-server-8bbd5674f-22jk8 0/1 Evicted 0 18d kube-system metrics-server-8bbd5674f-25x5c 0/1 Evicted 0 ..
일단 이 문서는 kubernetes 까지는 설치되어있다는 전제하에 실행하는 내용이다. brew install helm brew install kubectx 윗부분은 헬름 차트 사용을 위한 내용이며 밑에는 kubectx, kubens 명령어를 통해 효과적으로 클러스터를 관리하기 위함이다. kubectx를 설치하게 되면 kubens로 현재 가진 네임스페이스를 검색할 수 있고 kubens 명령을 통해 네임스페이스를 활성화 시킬 수 있다. 서비스 유지관리에서는 필수적인 기능이다. kubectx도 동일하게 사용하면 된다.