elasticsearch 구성 참고사항

elasticsearch 는 워낙 유명하고 안정적으로 성장한 오픈소스라 공식 문서, 커뮤니티, 블로그, 소스코드 등 참고할 자료들이 넘쳐난다. 굳이 그 넘쳐나는 자료에 한 숟가락을 더 얹을 필요가 있겠냐마는, 프로덕션 환경에 elasticsearch 를 처음 도입하려는 사람에게 찾는 수고를 덜 수 있는 best practice 를 제공하는 것이 이 문서의 목적이므로 누군가에게는 도움이 될 것으로 생각한다. elk 스택이나 관리용 플러그인, 키바나 사용법 등은 필자가 잘 모르기도 하고 워낙 좋은 문서가 많기 때문에 다른 문서를 참조하는 편이 낫다. 이 문서는 elasticsearch cluster 를 구성할 때 참고할 만한 사항들을 정리하였다.

ECK(Elastic Cloud on k8s)

ECK는 k8s 에 거부감이 없다면 elasticsearch 운영환경으로 선택할 수 있는 좋은 옵션으로, elasticsearch 개발사인 Elastic 에서 공식 배포하는 k8s operator pattern 이다. k8s 환경에 빠르게 적용할 수 있으며, elasticsearch 특성을 고려한 리소스 / lifecycle 관리가 가능하다.

Operator pattern이란?

k8s에서 기본 제공하는 방식으로 서비스 운영하기엔 도메인 특성이 적합하지 않아 반복적인 설정/변경작업이 잦을 경우 직접 custom resource 를 작성할 수 있는데, 이 custom resource 를 관리하는 확장 인터페이스가 operator 이며, 이렇게 custom resource 와 opertor를 제작하여 k8s 를 사용하는 패턴을 operator pattern 이라 한다.

elasticsearch 적정 메모리

elasticsearch 는 메모리의 크기가 매우 중요하다. 다큐먼트로부터 인덱스를 생성할 때에도 메모리를 사용하고, 검색 속도 향상을 위한 캐시에도 메모리를 사용하기 때문에 elasticsearch 가 빠른 성능을 내기 위해선 메모리 리소스가 넉넉해야 한다. 그럼 그 넉넉한 메모리의 적정 규모는 얼마일까?

jvm compressed oop

대부분 elasticsearch 와 적정 메모리 관련 문서를 찾아보면 jvm heap 에 32Gbytes 이상 할당하지 말라는 내용이 많을 것이다. compressed oop 라는 기능으로 메모리를 효율적으로 쓸 수 있는 최대치가 32Gbytes 이기 때문이다. 절반은 맞고 절반은 틀렸다.

Compressed OOPs in the JVM | Baeldung
compressed oop란 0으로 padding 되어 실질적으로 사용하지 않는 주소 영역 3bit 도 addressing 에 활용하는 기술이다. 2^3 만큼 이득이므로 32bit(=4G) x 8 = 32Gbytes 까지 addressing 이 가능하다.

64bit 주소를 사용하면 메모리 공간 내에서 데이터 저장영역이 그만큼 줄어들기 때문에 효율성 측면에서 heap size는 32Gbytes를 넘지 않는 편이 좋았다. 과거에는 말이다.

zgc

zgc는 java11 부터 사용할 수 있는 신규 gc 이다. 벤치마크를 확인해 보면 성능이 매우 뛰어남을 알 수 있다. 허나 zgc를 사용하려면 compressed oop 를 쓰면 안된다. 0으로 채워지는 padding 영역을 zgc에서 사용하기 때문이다.

64bit 주소체계에서 18bit 는 사용되지 않는다. zgc는 저 사용되지 않는 공간을 활용하여 gc 의 성능을 높였다. 기회가 되면 zgc에 대해 따로 다뤄보겠다.
gc 벤치마크이다. zgc의 성능이 매우 높음을 알 수 있다. 또한 gc 에서 발생하는 latency 가 낮기 때문에 체감 성능은 기존 mark&sweep 이나 g1gc보다 월등히 높을 것으로 보인다.

compressed oop 는 32Gbytes 제약이 있으나 32bit 주소체계이기 때문에 메모리 공간을 효율적으로 사용할 수 있다. 반면 zgc는 64bit 주소체계이기 때문에 메모리 공간 사용률이 효율적이지 않지만 gc 성능이 빠르다. 그럼 둘 중에 어느 것이 효율적일까? 정해진 답은 없으나 heap size 가 32Gbytes 이하라면 compressed oop, 그 이상으로 heap을 크게 써야 한다면 zgc를 사용하는 편이 이득일 것으로 보인다.

lucene mmaped io

elasticsearch에 메모리를 할당할 때 주의할 점이 하나 더 있는데, 서버의 모든 메모리 리소스를 jvm에 할당하면 오히려 성능상 불리해질 수 있다. lucene은 memory mapped io 를 사용하는데, virtual memory 의 원활한 paging 을 위해 시스템 영역에 충분한 메모리를 남겨두어야 한다.

The Generics Policeman Blog: Use Lucene's MMapDirectory on 64bit ...
lucene 의 MMapDirectory 는 virtual memory를 사용하는데, virtual memory 의 성능을 위해서 시스템 영역에 충분히 메모리를 남겨둘 필요가 있다.

Maximum shards in node

elasticsearch 를 default 설정으로 사용하였을 때, index 하나 당 shard 갯수는 5개, node 당 maximum shard 갯수는 1000개이다. 필자는 이걸 모르고 index를 많이 만들었다가 shard 갯수가 1000 개를 초과하여 더이상 index를 생성하지 못하는 문제를 겪었다. node 당 shard 갯수는 설정으로 조절이 가능하므로 shard 를 늘리고 싶다면 클러스터 설정을 바꾸면 된다.

그렇다면 node 하나 당 적절한 shard 갯수는 얼마일까? elasticsearch 공식 블로그에 따르면 적절한 heap 1Gbyte 당 shard 20개가 적절하다고 하니 참고하길 바란다. (https://www.elastic.co/kr/blog/how-many-shards-should-i-have-in-my-elasticsearch-cluster)

Hot-Warm architecture

elasticsearch 는 저장 비용이 큰 편이다. 주어진 리소스가 데이터 양에 비해 충분히 넉넉하다면 별 문제가 없겠으나, 리소스를 효율적으로 사용하려면 아키텍처를 적절히 구성하여야 할 것이다. 일반적으로 최근 데이터는 검색을 자주하는 반면 오래된 데이터는 그렇지 않은 경우가 많은데, hot-warm 모델은 index 를 고성능 data node(hot) -> 저성능 data node(warm) -> 삭제 의 순서로 이동시키며 lifecycle을 관리하는 아키텍처이다.

hot-warm_cluster.png
Hot node 는 고성능의 저장장치와 높은 메모리로 구성, 빈번한 읽기/쓰기 작업을 감당할 수 있도록 한다. 최초에 Hot node에서 생성한 index는 일정 시간이 경과하면 Warm node 로 이동시킨다. Warm node 는 고용량의 저가 저장장치로 구성, 참조 빈도가 낮은 데이터를 보관하는 용도로 사용한다.

opendistro ISM

opendistro의 ISM(Index State Management) 기능을 사용하면 Hot-Warm architecture 의 index lifecycle 을 쉽게 관리할 수 있다. opendistro에는 다른 여러 부가기능들이 있으므로 관심있으면 공식 문서를 참조 바란다.

OSX 환경에서 CI/CD 자동화

현 시점에선 이 구성을 사용 안하지만 조사해 둔 내용이 아까워서 osx 환경에서 CI / CD 자동화 관련 참고할만한 문서 링크들을 정리해 둔다.

결론부터…

  • 여러 버전의 ios sdk 관리는 xcode-select / xserver 사용
  • unreal 이나 unity 같이 gpu / 하드웨어 특성을 타는 빌드 환경이 아니라면 vagrant
  • 하드웨어 종속성 탓에 물리적인 빌드환경이 필요하다면 ansible

ios sdk 빌드 관련 문서

원칙적으로 sdk는 하위 호환성을 보장하여야 한다. 허나 현실에서 반드시 최신 버전의 빌드도구가 하위 버전을 지원한다는 보장은 없다. 여러 프로젝트를 하나의 머신에서 빌드해야 하는데 sdk나 서드파티 라이브러리 버전이 서로 배타적일 때, 모든 프로젝트의 빌드환경을 만족하는 구성을 관리하는건 손이 많이 가는 일이다. 특히 ios sdk 의 패키지 / 종속성 관리는 애플에서 제공하는 대로 따르는 수 밖에 없기 때문에 더욱 귀찮다.애플에서 제공하는 문서를 잘 찾아보고 읽어야 한다.

인프라 자동화 관련 문서

osx가 리눅스나 윈도우처럼 docker 환경을 지원한다면 빌드환경을 구성하는게 편했을텐데 아쉽게도 osx 는 docker를 지원하지 않는다. vm 환경 또한 구성하는게 편하지는 않다. 공식적으로 os image 다운로드 링크를 제공해주지도 않을 뿐더러, osx 이외에 다른 host os 에서 osx vm을 실행하는건 불법이기 때문이다. 하지만 어떻게든 vm 환경을 구성할 수 있으며, vagrant 같은 vm 관리도구로 인프라를 자동화할 수 있다.

하지만 unreal 이나 unity 처럼 gpu 하드웨어에 종속적인 개발환경을 병행하여야 한다면 vm으로 빌드 인프라를 구성할 수는 없다. 이런 경우에 쓸 수 있는 좋은 솔루션으로 ansible을 추천한다. ansible galaxy 에는 ios 개발환경을 쉽게 자동화할 수 있는 양질의 레시피들이 제공되므로 참고해 보길 바란다.

겜섭알못의 게임서버 아키텍처 101 #1

서론

별다른 언급 없이 서버라 하면 당연히 웹서버를 떠올릴만큼, 웹기술은 서버-클라이언트 모델의 대세다. 웹 서버 기술은 상당히 많은 연구와 응용이 수십년간 진행되었기에 표준, 프레임워크, 아키텍처 등이 정형화되었고, 따라서 서버 개발자는 거의 도메인 모델 구현만 신경쓰면 되는 수준에 이르렀다. 허나 게임 서버는 웹과는 많은 것들이 다르다. 게임 장르와 대상, 목적에 따라 기술이나 아키텍처가 달라지기 때문에 정형화할 만한 영역이 많지 않다. 또한 웹과는 다르게 게임 진행중 서버-클라이언트는 연결성을 유지하고 있어야 한다. 이러한 요구사항, 기술적 차이 외에도 규모의 차이가 있다. 시장 규모, 매출을 기준으로 하면 게임 서버 시장이 결코 작지 않으나 개발자 인력 풀 관점에서 게임 개발자는 다른 도메인에 비해 소수다. 웹서버 개발 10년차 베테랑이라 할지라도 멀티쓰레드 환경에서 발생하는 다양한 동시성 문제나 소켓 통신에 따른 네크워크 문제, 위상 변화에 따른 위치문제 등을 현업에서 겪었을 가능성은 높지 않다. 때문에 게임 업계는 다른 업계 종사자가 전직하기엔 진입장벽이 높은 고인물들의 닫힌 시장인 경향이 있다.

본인의 커리어에 게임서버 백엔드 경험이 없기 때문에 이쪽 분야에 대한 기술적 특징이나 아키텍처를 짚고 넘어가야 할 필요를 느낀다. 다행스럽게도(?) 본인의 커리어가 워낙 잡스러웠던 탓에 다른 사람들 보다 게임 서버 기술을 이해하는데 조금은 낫지 않나 싶다. 이 글에선 게임 서버 기술 및 아키텍처의 일반론을 서술하고, 필요한 경우 웹 기술과 비교하면서 그 특징의 이해도를 높이도록 하겠다. 본인도 겜섭알못이기 때문에 글에 깊이가 없을 수 있음은 감안해 달라. 게임 개발에 흥미가 있는 주니어나 전업을 고민하는 개발자에게 도움이 되었으면 좋겠다.

Stateless vs Stateful

일반적으로 웹 컨텐츠는 모두에게 동일한 결과를 제공해준다.

웹은 기본적으로 stateless 하다.  100명의 사용자에게 하나의 동일한 페이지를 제공하는 것이다. 반면 게임은 기본적으로 이전의 상태를 저장하고 있어야 한다. 같은 아이템을 사용해도 사용자 레벨이나 능력치에 따라 다르게 적용되는 경우도 있고, PvP 상황에선 누가 먼저 공격을 했는지에 따라 결과가 달라질 수 있다.

물론 현재의 웹은 로그인도 필요하고 장바구니도 필요하고 결제, 배송 내역을 확인할 필요도 있기 때문에 이전의 상태값을 저장해야 한다. 비즈니스 모델의 요구사항이 사용자 개개인의 상태를 저장하도록 발전해왔기 때문에 웹에도 다양한 방법으로 이전 상태를 저장하는 기술이 추가되었다.

허나 어떤 특정 상황에서 웹기술로 이전 상태를 저장하는 데에는 근본적인 한계가 있다. 1) 아주 짧은 시간 동안, 2) 상태가 계속 바뀌는데, 3) 상태변화의 순서가 나와 타인에게 영향을 주는, mmorpg에선 일반적으로 발생하는 그런 상황은 웹기술로 처리하기가 곤란하다. 웹프로토콜이 http이기 때문이다.

가장 흔한 http 클라이언트인 웹브라우저로 예를 들어보자. 웹브라우저는 사용자가 브라우저를 사용하는 대부분의 시간동안 서버와의 연결이 끊어져 있다. 어떤 페이지에 접근을 하기 위해 요청을 하면 그때 서버와 연결을 하고, 응답을 받으면 바로 서버와 연결을 끊는다. 간단하게 원하는 리소스를 가져올 수 있는 장점이 있지만 리소스를 가져올 때 마다 매번 새로 연결 / 연결 해제하므로 아무리 응답이 빨라도 연결 수립을 위한 시간이 소요된다. 요즘 흔한 웹기반 모바일 게임 장르에 fps 나 mmorpg가 없거나, PvP 관련 컨텐츠가 존재하지 않는 이유가 웹기술의 이러한 한계 때문이다.

Realtime event

반면 게임서버는 빠르게 요청되는 유저 간의 이벤트를 순서대로 처리하기 위해 클라이언트/서버 간에 연결을 유지한다.  위치의 이동, 스킬 또는 아이템의 사용, 공격과 회피에 따른 상태 변경 등을 게임월드에 요청하면 게임서버는 이를 순서대로 적용하여 결과를 사용자에게 돌려주는데 이때 소요되는 시간은 게임 진행에 무리가 없도록 충분히 짧아야 한다.

Key pain points of web application development
웹페이지 컨텐츠를 기다려 주는 시간은 일반적으로 3초 정도라고 한다.

일반적으로 웹 컨텐츠의 응답시간은 3초 이내로 상정한다. 반면 게임 서버는 100ms 이내에 응답이 와야 원활한 플레이가 가능하다. 네트워크에서 가장 코스트가 큰 작업이 연결이므로 연결 비용을 줄이려면 게임 클라이언트/서버는 연결을 유지하여야 한다.

게임에서 요구되는 빠른 응답성과 연결성, 이 두 가지 특징은 서버 운영 및 아키텍처에 큰 도전 과제다. 후술할 게임 서버의 다른 특징들은 상기 두 가지 특징으로부터 파생되었다 하여도 과언이 아니다.

Logical / physical topology – Load balancing

다수의 사용자를 처리하기 위한 서버 운영 기술 중 여러 개의 서버를 로드밸런싱하는 방법이 있는데, 게임 서버에서는 이런 구성을 하기 전에 한 번 더 고민하여야 한다. 사용자 간에 데이터 교환이 일어나기 때문이다. 쿠팡이나 11번가 같은 쇼핑몰 사용자들은 서로 통신할 일이 없기 때문에 다른 사용자가 어느 서버에 접속하던 전혀 상관할 필요가 없다. 반면 게임 서버는 사용자 간 논리적 거리가 가까우면 물리적으로도 가까워야 한다. 최소한 서버간 데이터 교환에 걸리는 시간이 응답성에 영향을 주지 않을 정도로 짧아야 한다. 때문에 게임서버는 같이 게임을 진행하는 유저들을 물리적으로도 같은 서버에 위치시키도록 유도한다.

오버워치 서버 탐색기 A to Z : 이런 것도 가능해?! : 네이버 포스트
어떤 게임은 함께 플레이하는 유저들을 물리적으로 같은 서버에 위치시키도록 대기실에 입장하는 단계를 거치기도 한다.

이러한 토폴로지적 특징(특정 유저군을 물리적/논리적으로 동일한 위치에 모아야만 하는) 때문에 게임 서버는 로드밸런싱이 어렵다. 웹 서버의 로드밸런서 – 백엔드 구성을 떠올려보자. 웹의 특징 – connectionless / stateless – 에 따라 모든 서버는 독립적이다. 사용자는 어느 서버에 접속하여도 동일한 리소스를 제공받는다. 따라서 로드밸런서는 부하 분산의 역할에 충실하여 접속하는 사용자들을 골고루 분산시키기만 하면 된다. 허나 게임서버의 부하분산은 기술적 도전과제다.

Long connection – Scalability

컴퓨터 네트워크에서 가장 코스트가 높은 작업은 커넥션이다. 바꿔말하면 최초로 커넥션을 생성할 때 걸리는 시간이 가장 길다는 뜻이기도 하다. 물론 최근의 웹소켓이나 스트리밍 컨텐츠 같은 예외들이 있지만, 일반적으로 웹은 요청 시 마다 새로 연결을 생성하고 응답을 받으면 연결을 종료한다. 이러한 특성 때문에 웹서비스는 서버의 사용량에 맞추어 수평적 스케일링을 하기 용이하다. 모든 요청 시 마다 새로 커넥션을 생성하는 구조이기 때문에 기존 유저가 신규 서버에 접속하여 리소스를 요청하여도 문제가 없다.

반면 게임 서버 같은 경우는 앞서 말한 빠른 응답성을 보장해야 하기 때문에 커넥션을 매번 새로 맺는 비용을 감당할 수 없다. 따라서 게임 서버는 일반적으로 커넥션을 유지한 상태로 데이터 교환을 한다. 이러한 연결성을 유지해야 하는 제약조건 때문에 게임 서버는 스케일링이 웹서비스처럼 용이하지가 않다. 높은 연결성과 관련한 문제들은 물리적인 한계이기 때문에 게임 디자인 / 서버 아키텍처를 잘 구성하여 게임 서비스 중에도 스케일링을 하기 좋은 형태로 처음부터 설계하여야 한다.

게임의 성격에 따라 서버-클라이언트 네트워킹 외에 서버-서버 간 통신이 이루어져야 하는 경우도 많다. 다수의 월드 서버로 구성된 MMORPG 게임이 있다고 가정하자. 월드 내에서 일어나는 이벤트 중에선 모든 서버에 공유되어야만 하는 사건들도 존재한다. 이러한 니즈 때문에 게임 서버들은 각각의 게임 서버들 끼리 거미줄처럼 서로 통신하게 된다.

game_server_arch
좌측의 웹서버는 서버간 연결이 불필요한 반면, 우측의 게임서버는 거미줄처럼 n대n 통신을 하여야 한다. – 출처 NetEase/pomelo

하지만 이러한 n대n 연결 구조에서 큰 고민 없이 아키텍처를 구성하면 가용성 향상을 위해 서버를 늘렸을 때 오히려 커뮤니케이션 비용이 올라가버린다. 서버를 추가하였으나 도리어 성능이 저하되는 원치 않는 결과를 초래하기 때문에 주의하여야 한다.

다음 글에선 일반적인 게임 아키텍처 패턴, 그리고 게임서버와 관련된 기술들을 열거해 보도록 하겠다.

아이에게 프로그래밍 가르치기

예전부터 아이들에게 프로그래밍을 가르치는 일에 흥미가 있었다. 특히 올해는 우리집 멍멍이가 초등학교에 입학할 나이가 되었기 때문에 개발자 아빠로서 뭐라도 알려주어야겠다는 생각이 든다. 이참에 아이에게 프로그래밍을 가르칠 때 무엇을 염두에 두어야 하는지 글로 정리해 보려고 한다.

 

코딩 교육 의무화

2019년도부터 초등학생에게 코딩교육을 의무화하였다 한다. 사실 코딩 교육 의무화는 2015년부터 계획되어 있던 것이라 놀랄 일은 아니다. 다만 코딩이 공교육과 입시의 영역으로 들어오게 되었을 때 생길지 모를 부작용 때문에 각계에서 우려가 많은 것으로 안다.

본인은 현업 교사도 아니고 입시 전문가도 아니기 때문에 현 코딩 교육 실태에 대한 평가가 맞지 않을 수도 있음을 감안하고 들어달라. 코딩 교육은 2019년부터 의무화가 되었지만 현장 교육은 학교마다 차이가 있다. 어떤 곳은 저학년부터, 어떤 곳은 5/6학년부터 코딩 교육을 실시한다. 왜 이렇게 차이가 나는가 하면 아직 공교육의 영역에 들어올 만큼 커리큘럼이 자리를 잡지 못한 상태에서 의무화를 서둘렀기 때문이라고 생각한다. 이런 경우 예상할 수 있는건 코딩 교육의 난이도가 많이 낮을 것이라는거다. 실제로 교재들을 찾아보면 부교재의 품질(로봇을 움직인다던지, 악기를 연주한다던지)에 차이가 있을 뿐 코딩의 난이도가 높은 과정은 찾아볼 수 없었다. 허면, 앞으로도 그럴 것인가 하면 그건 알 수 없다. 향후 코딩 교육 난이도의 향방은 입시 포함 여부가 결정할 듯 하다. 입시에 코딩이 포함되려면 변별력을 두어야 할텐데, 사실 코딩문제를 어렵게 내려면 그 난이도는 끝도 없이 높일 수도 있다.

개인적인 의견을 말하자면, 본인은 그다지 주입식 교육을 좋아하지는 않는다. 코딩 교육도 주입식 교육과 그다지 어울리지는 않는 영역으로 보인다. 허나 만약 코딩을 현 입시제도 하에서 주입식으로 가르친다 가정한다면 다른 어떤 과목보다도 실용적이기는 할 것이라 본다. 12년 입시 공교육 체제에서 배운 지식 중 실용적인 학문이 얼마나 될까? 기껏해야 영어 / 제2외국어 / 한문 정도? 본인은 수학도 좋아했고 과학도 좋아했고 철학 / 문학 / 역사도 즐겁게 배웠다. 공교육 체제 아래 배운 이러한 지식들이 본인의 관점과 지평을 넓혀주었다는 점을 부인할 수는 없으나, 그 지식들은 실용성과는 정말 거리가 멀었다. 심지어 변별력을 위해 무의미하게 난이도를 엄청나게 올린 입시 스킬은 정말 쓰잘데기 없는 죽은 지식들이다.  80평생 동안 ‘반데르발스 힘’ 같은걸 써먹을 일이 단 한 번이라도 생길까?

반면 코딩은 조금 상황이 다르다. 예를 들어 대입 시험에 임의의 숫자 배열을 merge sort하는 방법과 그때의 시간복잡도를 증명하는 문제가 출제된다면 이것도 죽은 지식일까? 물론 실용성 측면이라면 좀 전에 예로 들은 ‘반데르발스 힘’과 큰 차이가 없을 지도 모른다. 허나 merge sort는 컴퓨터나 핸드폰을 사용하는 사람이라면 알던 모르던 매 순간 마주하는 알고리즘일만큼 우리 일상에 가까운 것이다. 심지어 입시 공부로 merge sort를 배운 학생이 어느 날 갑자기 영감이 떠올라 개선된 탐색 알고리즘을 제안할 수 있을지도 모른다. 왜냐하면 생각은 누구나 할 수 있고, 그 생각의 결과물을 제안하는 방법도 누구에게나 열려 있기 때문이다.

기존의 입시과목의 실용성이 0이라면 단언컨대 코딩은 살면서 반드시 쓰일 일이 생긴다. 이 글을 읽는 독자가 설령 비개발자여도 엑셀 함수나 받은 편지함 분류 따위의 간단한 자동화는 직장에서 필수적이다. 현재에도 이런데 미래에 12년간 코딩 의무교육을 이수한 사람이라면 얼마나 많은 일들을 자동화 해낼 수 있을까.

코딩 교육 의무화는 본인이 다루고자 하는 주제의 본질과는 살짝 거리가 있으므로 ‘코딩 교육은 본질적으로 주입식과는 맞지 않으나, 만약 주입식으로 가르친다면 그나마 다른 학문에 비해 실용적일 것이다.’ 정도로 정리해본다.

 

Computational thinking

입시 코딩은 일단 제껴두자. 입시를 제외한다면 코딩 교육은 무엇을 목적으로 하여야 할까? 필자는 computational thinking 이어야 한다고 생각한다. 다른 말로 하면 ‘문제 해결 능력’인데, 그냥 문제를 해결하는 것이 아니라 문제 해결의 절차를 실행 가능한 작은 단위로 나누어 서술하는 능력을 말한다. 문제해결의 절차는 논리적으로 서술할 수만 있으면 도구는 무엇이던 크게 상관이 없다. 아래 링크한 두 영상은 컴퓨터 없이 코딩 교육을 진행하는 좋은 예제다. 영상에서 작성한 문제 해결의 절차를 컴퓨터가 제공하는 명령어로 치환하면 바로 코딩이 된다.

EBS 소프트웨어야 놀자 – 쓱싹쓱싹 로봇 청소기

스크린샷 2020-02-16 오후 9.10.29

[한글] 샌드위치 만들기

[원본] Exact Instructions Challenge PB&J Classroom Friendly

스크린샷 2020-02-16 오후 9.26.02

코딩학원이나 학교의 교재를 살펴보면 엔트리나 스크래치 류의 블록코딩 언어부터 시작하는 경향이 있다. 이후에 라즈베리파이나 아두이노, 마이크로비트 같은 IoT 하드웨어를 제어하는 방법을 배우고, 파이썬이나 c언어 등의 프로그래밍 언어를 배우는 식으로 커리큘럼이 만들어져 있다.

블록코딩이나 IoT 기기들로 코딩을 시작하는 것이 나쁘다는건 아니다. 아이들은 쉽게 접할 수 있으면서 결과가 눈에 보이는 것들에 쉽게 흥미를 보인다. 허나 이런 것들은 본질이 아니므로 아이가 충분히 우수하다면 굳이 흥미 본위의 교육에 시간과 비용을 뺏길 필요는 없다. 가끔 블록코딩으로 엄청나게 복잡한 제어로직을 작성하거나 IoT 교재에 많은 비용을 들이는 경우가 있는데 굳이 그럴 필요가 없다는거다.

 

Structured programming

현대의 거의 대부분의 프로그래밍 언어는 구조적이다. 왜냐하면 프로그래밍 언어가 구조적이지 않을 경우, 그 복잡도가 인간이 제어할 수 없는 수준으로 높아지기 때문이다. 아래 링크한 아티클을 굳이 읽어볼 필요는 없으나 업계에서 전설처럼 회자되는 ‘~considered harmful’ 의 시조이자 비구조적 언어의 한계를 명백히 하여 현대의 프로그램 언어가 구조적으로 자리잡는 분기점이 된 사건이기에 링크해 보았다.

GOTO considered harmful(전설의 레전드의 시작…)

각설하고, 아이들에게는 구조적 프로그래밍의 구성단위만을 알려주면 된다. 컴퓨터에 특별한 소질을 보이면서 진짜 내부 동작원리를 궁금해 하는 아이라면 실제 컴퓨터의 명령어 수행은 비구조적이라는 사실을 알려줄 수도 있겠으나, 보통의 아이들에게 필요한 교육은 1) 순차 2) 분기 3) 반복 4) 함수 의 4가지 구성단위이다. 구조적 프로그래밍의 자세한 내용은 기회가 되면 다뤄보도록 하자.

 

그밖에 주제들

다음 주제들을 아이 가르칠 때 염두에 두어야 할 듯 하다. 허나 저학년이 이해하기에는 내용이 쉽지 않으므로 염두에만 두도록 한다. 혹시라도 고학년이나 우수한 학생들을 가르칠 기회가 생긴다면 아래 주제들을 다뤄보도록 하자.

  • 기계의 한계
  • 알고리즘
  • NAND to Tetris
  • No silver bullet – programming paradigm

OSX 의 exception handling 순서

오랜만에 올리는 블로그 글의 주제는 OSX 의 exception handling 순서이다.

OSX kernel 구조

애플 개발자 문서 링크 – Kernel Architecture Overview

Signal handling 순서를 설명하기 전에 알아둘 사전 지식, OSX 의 커널 구조를 알아보자.

C436D54C-9BDD-4FC0-B225-DAFF54156938

OSX 커널은 BSD와 Mach 의 디자인을 둘 다 따르고 있다.

맥 os 의 발전사를 깊이 알지 못하는 필자로선 이런 디자인이 캘베로스나 히드라의 ‘한 몸 – 두 머리’처럼 꽤나 기괴한 설계로 보인다. 운전석과 조수석에 각각 핸들이 달려있는 자동차를 상상해보자. 서로 핸들을 반대 방향으로 꺾을 경우, 이 자동차는 어디로 가야하는가?

다행히(?) OSX 에서 BSD와 Mach 사이에 이런 문제는 발생하지 않는다. 두 커널은 담당하는 레이어가 분리되어 있다. 아래 발췌해 온 문서를 참고해 보자.

Mach

Mach manages processor resources such as CPU usage and memory, handles scheduling, provides memory protection, and provides a messaging-centered infrastructure to the rest of the operating-system layers. The Mach component provides

  • untyped interprocess communication (IPC)
  • remote procedure calls (RPC)
  • scheduler support for symmetric multiprocessing (SMP)
  • support for real-time services
  • virtual memory support
  • support for pagers
  • modular architecture

General information about Mach may be found in the chapter Mach Overview. Information about scheduling can be found in the chapter Mach Scheduling and Thread Interfaces. Information about the VM system can be found in Memory and Virtual Memory.

BSD

Above the Mach layer, the BSD layer provides “OS personality” APIs and services. The BSD layer is based on the BSD kernel, primarily FreeBSD. The BSD component provides

  • file systems
  • networking (except for the hardware device level)
  • UNIX security model
  • syscall support
  • the BSD process model, including process IDs and signals
  • FreeBSD kernel APIs
  • many of the POSIX APIs
  • kernel support for pthreads (POSIX threads)

The BSD component is described in more detail in the chapter BSD Overview.

주저리 주저리 설명되어 있지만 거칠게 요약하면 Mach 커널은 리소스에 대한 보다 추상화된 영역을 관리하는 반면, POSIX 커널은 상대적으로 하드웨어에 밀접한 영역을 관리한다고 볼 수 있다.

 

Exception?

Exception 이란 ‘프로그램에서 정의하지 않은 동작을 처리하기 위한 추상화’ 이다. 텍스트 뷰어 프로그램을 예로 들면, 파일을 열고 안의 내용을 볼 수 있게 화면에 띄워주는 기능은 프로그램에서 정의한 동작이다. 허나 파일을 열려고 시도했는데 해당 파일이 지워져서 찾을 수 없다면? 더 이상 프로그램은 정의된 동작을 수행할 수가 없다. 이러한 ‘파일을 찾을 수 없는 상태’를 추상화하여 이를 제어하는 메커니즘을 제공하는 것이 Exception handling 이다.

 

Signal?

Signal 이란 OS에서 발생한 이벤트를 프로세스에게 전달하기 위한 software interrupt 이다. Signal은 경찰관이 부는 호루라기 소리와 같다. 운전자가 술을 먹고 중앙선을 침범하였을 때, 운전자를 멈춰세우고 면허를 취소시키기 위해 호루라기를 부는 것이다. 이때 보통의 운전자들은 경찰의 지시에 따라 모든 것을 체념하고 갓길에 차를 댄 후 면허증을 반납한다. 헌데 가끔씩 있다. 경찰의 부름에 제멋대로 GTA 를 찍는 돌+I 들이 말이다. 이와 유사하게, Signal이 발생했을 때 프로세스는 default action(종료, 덤프 생성 등)을 수행한다. 허나 default action을 따르지 않고 Signal handler 를 등록하여 동작을 바꿀 수도 있다.

 

Handling 순서

Exception 과 Signal 모두 하드웨어 리소스에 대한 프로세스의 잘못된 접근에 의해 발생할 수 있다. OSX의 경우, Mach exception handler 와 POSIX signal handler 를 둘 다 제공한다. OSX 프로그램에서 Exception handler 와 Signal handler 를 둘 다 정의한 경우 프로그램은 아래의 순서로 동작한다.

  1. 제일 먼저 Mach exception 이 발생한다.
  2. 발생한 Mach exception handler 가 있는지 찾아본다. 있으면 handler 수행 후 종료.
  3. exception handler 가 없으면 해당하는 POSIX signal 이 발생한다.
  4. 발생한 POSIX signal handler 가 있는지 찾아본다. 있으면 handler 수행 후 종료.
  5. Signal handler 가 없으면 EXC_CRASH exception 이 발생한다.
  6. Apple crash report server 로 관련 crash 를 전송한다.

 

한국에서는 시스템 프로그래밍을 할 기회가 많지 않은데, 하물며 OSX 계열의 시스템 api 라면 더더욱 관련 경험을 얻기가 쉽지 않다. 필자 역시도 일이 아니었더라면 OSX의 커널 아키텍처는 아마도 평생 찾아볼 일이 없었을 것이다. 혹시라도 누군가 OSX 의 하드웨어 exception을 처리하면서 어려움을 겪고 있다면 이 글이 도움이 되길 바란다. 참고로 iOS 도 구조가 유사하다.

도서 리뷰 – 알고리즘 산책: 수학에서 제네릭 프로그래밍까지

알고리즘 산책 수학에서 제네릭 프로그래밍까지에 대한 이미지 검색결과

길벗 출판사 도서 소개

프로그래밍은 추상화(abstraction)의 연속이다. 데이터를 추상화하고 흐름을 추상화하고 모듈과 빌딩블록을 추상화하며 심지어는 서비스와 어플리케이션도 추상화한다.

헌데 추상화라는 단어만큼 추상적인 것도 없다. 누군가는 추상화라는 단어를 듣고 타입 추상화를 떠올릴 것이며 누군가는 자료구조나 객체를 떠올릴 것이다. 컴퓨터 과학에서 누군가가 추상화라는 단어를 사용한다면 이 단어가 다양한 계층에서 서로 다른 의미로 쓰인다는 것을 미리 알고 있어야 이해에 도움이 될 것이다.

알고리즘 산책에서 다루는 추상화는 크게 두가지이다. 수학적 추상화와 제네릭 프로그래밍이다.  이 책은 제네릭 프로그래밍이 어떻게 데이터 타입을 추상화 하는지에 대하여 여러 수학적 사례를 들어 설명한다. 이를테면, 고대 이집트인들의 곱셈하는 방식으로부터 곱셈 알고리즘을 도출한 후 이를 점진적으로 개선한다. 이후 이를 일반화하여 덧셈 연산으로부터 닫혀있는 타입에서 동작하는 템플릿으로 알고리즘을 재구현한다. 이 과정은 매우 흥미롭다. 알고리즘을 개선하는 시도와 이를 어떻게 일반화하는지를 보여주면서 제네릭 프로그래밍의 목적이 무엇인지 독자에게 자연스럽게 알려준다.

꽤 많은 수식과 증명이 나온다. 때문에 수학과 친하지 않다면 쉽게 읽히는 책은 아니다. 허나 저자의 친절한 설명과 함께 코드 구현이 수반하기 때문에 고교 수학 과정을 성실히 이수하였다면 이해하는데 큰 무리는 없을 것이다. 틈틈이 수학과 수학자의 역사를 읽을거리로 제공하는 것도 이 책의 가치를 높인다.

c++처럼 type define이 자유로운 강타입 언어에서 제네릭 프로그래밍이 갖는 의미는 매우 크다. 문제 해결하는 방법을 일반화하고, 이 일반화된 문제해결 방법이 어떤 타입에 제한되는지(또는 어떤 타입에 적용 가능한지) 정의하는 방법이 어떻게 수학의 문제해결 방식과 맞닿아 있는지에 대한 설명이 탁월하다. 누군가가 제네릭 프로그래밍을 주제로 책을 추천해 달라 한다면 알고리즘 산책은 단연 선순위이다.

주개발 언어가 c++ 가 아닌 프로그래머라면 type에 조건을 주는 concepts 부분이 잘 이해가 가지 않을 수도 있겠다. 이번 기회에 이 책을 읽으면서 인식의 지평을 넓히는 계기가 되었으면 한다.

concepts 소개

마지막으로 이런 훌륭한 책을 리뷰할 수 있도록 출간해 주신 길벗 출판사에게 감사드린다.

kubernetes multi-node cluster 구성하기

kubernetes 공식 문서에서는 다양한 kubernetes cluster 구성 전략 을 제공하고 있다.

그 중 docker를 이용한 cluster 구성 방식(portable multi-node)으로 multi-node cluster 를 구성하는 방법을 기술한다.

설치 후 알게 된 사실

portable multi-node 는 kubernetes developer community 에서 업데이트가 뜸하다.  대신 kubeadm 활동이 활발하다.(관련링크) 아직 alpha release 이므로 좀 더 안정화될 때까지 기다렸다가(얼마 안남은 듯) kubeadm 으로 cluster 구성하는 것을 추천한다.

prerequisite
docker 만 있으면 됨
필자는 centos 7 에 설치하였다.

docker 설치
docker 설치는 이 사이트에서 하란대로 하면 쉽게 설치가 가능하다.

환경에 따라 docker daemon 이 올라오지 않는 문제가 있다.
필자의 경우에는 docker0 라는 가상 bridge 가 생성되지 않아서 강제로 docker0 브릿지를 생성하였다.

brctl addbr docker0
ip addr add 192.168.5.1/24 dev docker0
ip link set dev docker0 up
iptables -t nat -L -n

gnome gvfs 에서 io 를 엄청나게 점유해 버리는 문제가 있다.
관련 app / service 를 모조리 uninstall 하고 reboot 하자.

kubernetes docker image 설치

이 글을 쓰는 도중 kubernetes documentation 에서 docker multi-node 구성이 지워졌다.

앞으로는 kubeadm 으로 multi node 구성하면 된다. (링크 : https://kubernetes.io/docs/getting-started-guides/kubeadm/)

내가 이 글을 쓴 이유가 공홈 다큐멘테이션 대로 docker multi node 구성하면 설치가 안되기 때문이었는데 글 쓸 이유가 사라졌다.(ㅠㅠ)

글은 여기서 줄인다. 아마도 kubeadm 으로 설치하면 한방에 잘 설치 될거다.

 

kubernetes 로 flask web app 배포하기

kubernetes?

고대 그리스어로 조타수? 키잡이? 라는 의미라고 한다.
구글에서 개발한 container orchestration tool(vm 또는 container 관리를 자동화해주는 도구)이다.

 

why kubernetes?

사실 이 부분은 충분한 경험이 없어서 자신있게 말을 못하겠다.
온라인에서 이것 저것 찾아보면 몇 가지 후보군이 더 있다.

  • swarm
  • mesos / marathon
  • 기타(kotena, nomad …)

이 중에서 kubernetes 를 선택한 이유는
기본적으로 제공하는 기능과 설계구조가 전반적으로 낫다는 평(카더라)
업계의 선택 – 실무 활용 사례가 많다는 점

때문이다. 다른 오케스트레이션 툴 중에 더 나은 것이 있다면 얼마든지 변경할 수 있다.

 

설치

는 생략… 공식 홈페이지에 tutorial 이 잘 나와 있다.

클러스터링 전략을 어떻게 가져가느냐에 따라 다양한 방법으로 설치가 가능하므로
문서를 잘 읽어보고 본인의 환경에 맞게 설치하길 바란다.

처음 시작하는 사람들은 로컬 개발환경에 docker / minikube / kubectl 설치하면 된다.
https://kubernetes.io/docs/getting-started-guides/minikube/

 

flask app 만들기

아래와 같이 간단하게 동작하는 flask app을 만들자.

중요!
host 설정을 0.0.0.0 으로 하여야 가상 컨테이너 외부에서 별도 proxy 없이 접근 가능하다.

from flask import Flask
app = Flask(__name__)

@app.route("/")
def hello():
    return "Hello!!"

if __name__ == "__main__":
    app.run(host='0.0.0.0')

특별한 설정 없이 실행하는 것 만으로 웹 서비스를 제공한다.

$ python3 hello.py
 * Running on http://0.0.0.0:5000/ (Press CTRL+C to quit)
127.0.0.1 - - [11/Apr/2017 08:40:53] "GET / HTTP/1.1" 200 -

이 flask app 을 docker image 로 만들어 보자.

docker image / container 만들기

다음과 같이 Dockerfile 을 만들자.
기존에 제공된 python image 기반으로 조금 전에 만든 flask app 을 복사/실행하도록 하자.

FROM python:3.6
EXPOSE 5000
COPY hello.py .
RUN pip install flask
CMD ["python",  "./hello.py"]

만든 Dockerfile로부터 docker image 를 만들자.

$ docker build -t hello-flask:v1 .

이 docker image 가 잘 동작하는지 확인해 보자.

docker run -it --rm -p 5000:5000 hello-flask:v1
 * Running on http://0.0.0.0:5000/ (Press CTRL+C to quit)
172.17.0.1 - - [10/Apr/2017 23:54:50] "GET / HTTP/1.1" 200 -

 

 

kubernetes 로 docker container(pod 또는 deployment) 만들기

다음 2가지를 주의한다.
kubernetes 는 Dockerfile 로부터 container를 생성하는 기능은 제공하지 않는다. docker image를 미리 만들어 두어야 한다.
kubernetes 하위에서 실행되는 docker 환경은 시스템에 설치된 docker 환경과는 완전히 독립적이다. docker image / container 를 공유하지 않으므로 image를 다시 만들어야 한다.

$ eval $(minikube docker-env) //kubernetes docker 실행환경 전환
$ eval $(minikube docker-env -u) //kubernetes docker 실행환경 원복

kubernetes docker 실행환경으로 전환하여 docker image 를 만든 후, kubectl을 이용하여 다음과 같이 deployment(pod) 를 생성한다.

$ kubectl run hello-flask --image=hello-flask:v1 --port=5000
deployment "hello-flask" created

kubectl 을 이용해 deployment / pod 정보를 보면 아래와 같다.

$ kubectl get deployments
NAME             DESIRED   CURRENT   UP-TO-DATE   AVAILABLE   AGE
hello-flask      1         1         1            1           24s

$ kubectl get pods
NAME                              READY     STATUS    RESTARTS   AGE
hello-flask-2475082718-xw1s3      1/1       Running   0          3m

 

 

pod vs deployment ?

kubernetes 는 container / container group 의 단위로 pod 를 사용한다.
반면 deployment 는 pod 의 상태를 체크하여 pod 생성/재시작/scaling 을 담당한다.
pod 가 Object 라면 deployment 는 Factory 나 Builder 와 같은 관계랄까.

위와 같은 이유로 보통 kubectl 로 container 를 생성/삭제할 때에는 deployment 로 호칭하므로 참고하기 바란다.

 

deployment 로 service 만들기

deployment 만 생성하여서는 아직 서비스를 할 수가 없다.
다음과 같이 kubectl 명령을 사용하여 deployment 를 service 로 실행한다.

kubectl expose deployment hello-flask --type=LoadBalancer --name=hello-flask

kubectl 을 이용해 service 정보를 확인해 보자

$ kubectl get service hello-flask
NAME          CLUSTER-IP   EXTERNAL-IP   PORT(S)          AGE
hello-flask   10.0.0.245   <pending>     5000:30276/TCP   <invalid>

$ kubectl describe service hello-flask
Name:                   hello-flask
Namespace:              default
Labels:                 run=hello-flask
Selector:               run=hello-flask
Type:                   LoadBalancer
IP:                     10.0.0.245
Port:                   <unset> 5000/TCP
NodePort:               <unset> 30276/TCP
Endpoints:              172.17.0.2:5000
Session Affinity:       None
No events.

다음 minikube 명령을 이용하면 flask app 이 어느 external ip 와 mapping 되어 있는지 브라우저로 확인할 수 있다. 현재 별도로 kubernetes 에게 external ip/port 할당 관련한 설정을 하지 않았으므로 아무렇게나 할 것이다.

$ minikube service hello-flask
Opening kubernetes service default/hello-flask in default browser...

다음과 같이 stdout log 도 확인 가능하다.

$ kubectl logs -f hello-flask-2475082718-xw1s3
 * Running on http://0.0.0.0:5000/ (Press CTRL+C to quit)
172.17.0.1 - - [11/Apr/2017 00:36:00] "GET / HTTP/1.1" 200 -
172.17.0.1 - - [11/Apr/2017 00:36:00] "GET /favicon.ico HTTP/1.1" 404 -
172.17.0.1 - - [11/Apr/2017 00:38:15] "GET / HTTP/1.1" 200 -
172.17.0.1 - - [11/Apr/2017 00:40:47] "GET / HTTP/1.1" 200 -
172.17.0.1 - - [11/Apr/2017 00:42:22] "GET / HTTP/1.1" 200 -
172.17.0.1 - - [11/Apr/2017 00:47:26] "GET / HTTP/1.1" 200 -
172.17.0.1 - - [11/Apr/2017 00:47:27] "GET / HTTP/1.1" 200 -
172.17.0.1 - - [11/Apr/2017 00:47:27] "GET / HTTP/1.1" 200 -
172.17.0.1 - - [11/Apr/2017 00:47:27] "GET / HTTP/1.1" 200 -

중요!
container 기반 app 을 작성할 때에는 log를 반드시 stdout 으로 남기도록 한다.
그래야 log 를 container 와 별도로 수집 가능하다.