이놈의 충돌처리가 단순 연산만으로 작동하는게 아니고 케이스 바이 케이스로 처리할게 많아서 분기가 많다. 그러다보니 병렬화가 어렵다. 나름 죽도록 병렬화 했다고 생각하는데 실제 코드의 50%정도밖에 병렬화가 안되는것 같다.
코드 최적화는 할만큼 한거 같고 나머지는 GPU스펙에 달린듯.
이하는 NV Visual Profiler로 돌린 화면.
컴퓨팅 활용도 72.4%면 할만큼 했다고 생각한다. 매트릭스 연산이나 영상처리가 아닌지라 더 이상은 무리.
새로 구입한 책 Programmin Massively Parallel Processors [2]
CUDA로 계산하는 라이트맵
64비트 포팅 프로젝트 진척상황
비러머글 맥스8 플러그인 위저드 설정 요령
NDC 2012 발표자료 - GPGPU(CUDA)를 이용한 MMOG 캐릭터 충돌처리
2차 사내 스트레스 테스트 후기 [2]
DoF 결론 [2]
해킨토시 설치 성공 [2]
CUDA충돌처리 응용#2
유져모드 메모리 페이징 구현
nVidia Visual Profiler 4.1로 돌린 결과
간단한 눈 처리 [4]
사내 스트레스 테스트 [16]
새로 만든 서버용 네트웍 컴포넌트 I4DyuchiNET2.0 [2]
64비트 릴리즈 모드 테스트
TFS Backup Plan 삭제 방법
CUDA로 구현한 충돌처리 [5]
6core Xeon*2 + GTS250 CDUA 라이트맵 렌더링
주말동안 작업내용 [1]
요새 관심사는... [2]
로그인 유지