제가 IDC에 서버를 두고 앱 서버를 돌리는데, 이번에 남는 서버가 한 대 생겨서(문제는 램 드라이버 문제 때문에 CentOS 6.4부터 안 올라감 ㅁㅊ) 거기에 GPU 하나 끼워서 제 연구서버로 써볼까 생각을 해봤습니다. 서버가 1U짜리이기 때문에 서버 케이스 안에 GPU를 넣는 건 좀 오바고, riser(PCIE 연장선)을 이용해서 좁디 좁은 케이스 밖에 GPU를 두려고 생각을 해봤습니다. 찾아보니까 PCIE riser가 있긴 있는데, 대부분 비트코인 같은 사이버코인 마이닝용으로 나온 PCIE x16 to x1 밖에 없더군요(;;) 나름 서버 내부에 x16 레인이 있기 때문에 써보고 싶었는데 x1과 x16의 GPGPU 상의 성능이 크게 차이가 나지 않는다는 소리가 들어서 한 번 테스트해봤습니다.


만저 제 컴퓨터 사양은 다음과 같습니다.

CPU: Intel i7-5820K

RAM: DDR4 16GB

GPU: GTX970

HDD: SATA2 Seagate 320GB (08년도쯤에 생산된 것으로 추정됩니다 ㄷㄷ)

PSU: SuperFlower SF-600R14SE Silver Green FX


OS: Ubuntu 16.04.1

Kernel: Linux 4.4.0-34-generic

Software: neural-style, Torch7, CUDA 7.5, cuDNN(버전은 기억이 안 나네요)


참고로 테스트시에는 모니터 3개를 켜뒀고(DVI x 2, DP x 1) 크롬 켜두고, 터미널 창 세 개 켜뒀습니다. 한 터미널은 공백 상태(log 저장용이라 걍 켜둔 셈), 한 터미널에서는 neural-style이 돌아가고 있었고, 나머지 한 터미널에서는 아래의 명령어로 GPU를 모니터링했습니다.


watch -n 1 nvidia-smi


* 테스트는 riser를 끼운 상태(x1)에서 오후 12시쯤에 테스트했고, riser를 안 끼운 상태(x16)에서는 오후 8시쯤에 테스트했습니다. nvidia-smi를 확인해보니 GPU에 쓰로틀링이 걸리던데, 일단 아래 두 테스트할 때 riser 끼운 상태에서는 GPU 사용률이 95%에서 맴돌았고 riser를 안 끼운 상태에서는 97~100%를 맴돌았습니다. 제 방은 에어컨따위 틀지 않고 오직 선풍기만 틀어서 방안 온도는 크게 변하지 않았을 것으로 추정되어 테스트에 큰 영향은 없을 것이라 생각이 됩니다.


비교를 위해 사용한 riser는 아래 링크에 있는 riser입니다. 사실 이더리움 마이닝 테스트용으로 한 개 샀던 것인데, 딱히 마이닝할 일도 없고 이번에 성능 비교해서 잘 나오면 IDC에 박으려고 생각했던 것입니다. (무려 그 일주일 전에 알리에서 샀던 이어폰보다 먼저 오시는 riser 클라스 ㄷㄷ)

http://www.aliexpress.com/item/PCIe-PCI-E-PCI-Express-Riser-Card-1x-to-16x-USB-3-0-Data-Cable-SATA/32548726067.html?spm=2114.13010608.0.50.CpdraB



라이저를 끼우고 그래픽카드를 외부로 뺀 상황입니다.


그리고 테스트를 돌렸습니다. 테스트는 위에 써둔 것처럼 Torch7 기반의 neural-style을 GPU로 돌려봤습니다. 명령어는 아래와 같습니다.


time th neural_style.lua -style_image examples/inputs/picasso_selfport1907.jpg -content_image examples/inputs/brad_pitt.jpg -gpu 0


총 3회를 테스트하였으며 맨 밑의 더보기를 통해 그 로그들을 확인하실 수 있습니다. 참고로 이상하게 컴퓨터를 부팅한 이후 바로 torch를 돌리면 준비 때문인지 약간 딜레이가 있어서 두 테스트 다 처음에 1회 간단히 돌린 이후에 테스트를 돌렸습니다. (즉, 간단히 돌린 이 1회를 제외한 그 다음 테스트부터 아래 표에 반영되어 있습니다.)


테스트 결과는 다음과 같습니다. time 명령어를 통해 real 시간을 측정하였습니다.



흠... 생각보다 정말 듣던대로 x16과 x1에서의 성능차이는 크지 않았습니다. x16 riser가 구해지지 않으면, 지금 가지고 있는 이걸 IDC에 있는 서버에 끼워서 연구용 서버로 사용해야할 거 같네요. 굿굿


ps. 차트 이쁘게 넣어보겠다고 찾아보다가, Google Chart 모듈을 찾아서 넣어봤습니다. 정작 글 쓰면서 차트 모듈 사용해서 차트 작성한게 1시간 반정도 먹는 듯... ㅠㅠ


neural-style w/ riser


neural-style w/o riser


'Artificial Intelligence' 카테고리의 다른 글

PCIE x16 VS PCIE x1에서의 GPU 성능 비교  (0) 2016.08.10

+ Recent posts

티스토리 툴바