yuchi's Development Home


CUDA로 구현한 라이트맵 테스트 및 결론

조회 수 3831 추천 수 55 2010.06.11 05:20:37




평일 잠을 줄이고 주말을 최대한 투자한 끝에 엔진의 라이트맵 빌드를 CUDA로 처리할 수 있는 기능을 추가했다.
얼마나 삽질을 했는지...휴

아무튼 결과는 다음과 같다.

크게 만족스러운 것은 아니다. 10배쯤은 빨라질걸로 기대했으니까.

그래픽 카드가 좋으면 좀 더 좋은 결과를 얻었을지도 모르겠지만...

혹은 내 CUDA코드가 메모리 뱅크 충돌이라든가 기타 등등의 퍼포먼스 이슈를 제대로 처리하지 못했기 때문일수도 있다.


테스트 환경
CPU : Q6600 2.4GHz Quad Core
GPU : nVidia 9800GTX+ (128 cuda core)
OS : Windows 7 x64
RAM : 8GB


테스트 방법
1.개발맵중 라이트가 수 백개 박혀서 제일 느린 맵을 로드.
2.순수 라이트맵 계산 시간만을 구하기 위해 그림자 끈 상태로 미리 한번 빌드.
3.그림자를 켜고 라이트맵 빌드.이걸로 시간 측정


테스트 결과
Only CPU (4 Multi Threads)         -> 339568 ticks (339초)
Only GPU                                   -> 414572 ticks (414초)
GPU + CPU (4 Multi Threads)       -> 179245 ticks (179초)


고찰
9800GTX+와 요새 많이 쓰는 GTS250이 같은 GPU인데, 4개 코어를 풀로 활용하는 경우에는 Q6600과 같은 구세대 4코어 CPU보다 성능이 떨어진다.

병렬컴퓨팅 성능으로 보면 GTS250기준으로 GPU 한 개가 대략 2.4GHz 코어 3개정도의 성능이라고 볼 수 있다.

GTX480과 같은 엄청난 GPU를 사용하면 또 모르겠지만, 일반적인 GTS250정도로는 요새 많이 쓰는 I7 쿼드코어 정도의 CPU보다는 확실히 효율이 떨어질 것이다.

4core CPU기준으로는 GPU와 병행해서 사용하는 쪽이 약 2배가까이 빠르다.

2.8GHz 12코어(24스레드) 제온으로 테스트 했을때는 GPU를 병행해서 사용해도 고작 12%정도의 효율 향상이 있었다.

계산해보면 대략 2.8GHz 제온 코어 2개에 해당한다.

CPU값만 350만원씩 발라서 12코어 제온 정도 맞추면 GPU컴퓨팅이고 뭐고 생각할 이유도 없는 것이다.-_-; 뭐 그것도 용도 나름이겠지만.

매트릭스 연산이나 이미지 프로세싱과 같이 병렬화 하기 더 좋은 작업에서는 최대 100배 정도의 효율도 얻을 수는 있다고 생각한다. 다만 용도가 제한적이라는 점과 코드 작성,디버깅의 어려움을 감안한다면 기대보다는 효용성이 떨어진다.


결론
150만원 이하의 장비를 사용해야 한다면 CUDA를 병행 사용하는 것은 메리트가 있다.

쿼드코어 정도의 CPU를 사용하고 GTS250이상의 GPU를 사용한다면 CUDA를 사용하는 쪽이 효율 향상이 있다.

조립기준 500만원 혹은 메이커제품 1000만원 이상의 장비를 사용할 수 있다면 굳이 CUDA로 개발해야할 필요는 없을 것 같다.

후기
몇 일 밤을 샜는데.이런 샹. 효율이 이거 밖에 안돼?
아 울고 싶네.T_T

cagetu

2010.06.13 16:53:33
*.177.27.46

CUDA는 아직 안해봐서 모르겠는데, 아직은 좀 더 기다려야 하는가 보군요.
눈팅으로라도 잘 보았습니다. ^^

여치

2010.06.13 21:13:50
*.34.177.77

cagetu / 태생적인 한계가 분명히 있죠. 가령 BSP트리 구조를 CUDA의 글로벌 메모리 안에 유지한다거나 하는 것은 불가능한 일이구요. nvidia 홈피에 가보면 실제 적용 사례들과 샘플소스들이 있습니다. 100배 효율을 내는것도 있으니까 뭐 지금도 쓸만하지 않다고 할 순 없겠죠. 지금으로선 특정 용도에의 월등한 성능, 저렴한 가격의 병렬컴퓨팅에 그 의미가 있다 하겠습니다.

여치

2010.06.15 18:13:01
*.199.248.185

shared memory 사용에 대한 약간의 트릭과 global memory 억세스 단위를 32바이트로 끊어서 성능 향상시켰습니다. Q6600 + GTX9800+ 기준 성능향상 2.5배 정도 기록했습니다.
List of Articles
번호 제목 글쓴이 날짜sort 조회 수

간단한 눈 처리 file [4]

  • 여치
  • 2010-02-21
  • 조회 수 3218

프레임 자랑질. file [2]

  • 여치
  • 2010-04-03
  • 조회 수 3400

CUDA 첫 프로그램. 시작은 미약하지만.. file [2]

  • 여치
  • 2010-04-12
  • 조회 수 3388

cuda로 필터 만들기 첫번째 B/W필터 file

  • 여치
  • 2010-04-15
  • 조회 수 3517

새로 구입한 책 Programmin Massively Parallel Processors file [2]

  • 여치
  • 2010-04-19
  • 조회 수 3027

cuda 필터 만들기. 3*3커널을 이용한 필터링 file

  • 여치
  • 2010-04-21
  • 조회 수 5034

이미지 프로세싱 속도 비교 - CUDA vs CPU(single thread) file [2]

  • 여치
  • 2010-04-22
  • 조회 수 3831

Project ε(프로젝트 엡실론) 2차 알파 후기 file [2]

  • 여치
  • 2010-06-03
  • 조회 수 3584

Project ε(프로젝트 엡실론) 2차 알파 동영상

  • 여치
  • 2010-06-03
  • 조회 수 2977

CUDA로 계산하는 라이트맵

  • 여치
  • 2010-06-07
  • 조회 수 3018

CUDA로 구현한 라이트맵 테스트 및 결론 file [3]

  • 여치
  • 2010-06-11
  • 조회 수 3831

6core Xeon*2 + GTS250 CDUA 라이트맵 렌더링 file

  • 여치
  • 2010-06-15
  • 조회 수 3290

x64어셈코드에서 크래시한 경우 콜스택 확인 file

  • 여치
  • 2010-08-27
  • 조회 수 4390

별거 아니지만...노말방향 스케일 아웃라인의 활용 file

  • 여치
  • 2010-09-05
  • 조회 수 4209

nVidia Parallel NSight 소개 file

  • 여치
  • 2010-09-24
  • 조회 수 2952

Parallel NSight를 이용한 CUDA코드 디버깅 file

  • 여치
  • 2010-09-26
  • 조회 수 4478

프로젝트 엡실론 3차 알파 테스트 프리뷰 영상

  • 여치
  • 2010-10-13
  • 조회 수 2978

Depth of Field 구현중 file

  • 여치
  • 2010-11-24
  • 조회 수 3368

DoF 결론 file [2]

  • 여치
  • 2010-12-07
  • 조회 수 3043

해킨토시 설치 성공 file [2]

  • 여치
  • 2010-12-09
  • 조회 수 3068
天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet



XE Login

天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet