이놈의 충돌처리가 단순 연산만으로 작동하는게 아니고 케이스 바이 케이스로 처리할게 많아서 분기가 많다. 그러다보니 병렬화가 어렵다. 나름 죽도록 병렬화 했다고 생각하는데 실제 코드의 50%정도밖에 병렬화가 안되는것 같다.
코드 최적화는 할만큼 한거 같고 나머지는 GPU스펙에 달린듯.
이하는 NV Visual Profiler로 돌린 화면.
컴퓨팅 활용도 72.4%면 할만큼 했다고 생각한다. 매트릭스 연산이나 영상처리가 아닌지라 더 이상은 무리.
요새 관심사는... [2]
사내 스트레스 테스트 [16]
nVidia Visual Profiler 4.1로 돌린 결과
TFS Backup Plan 삭제 방법
새로 만든 서버용 네트웍 컴포넌트 I4DyuchiNET2.0 [2]
유져모드 메모리 페이징 구현
가칭 프로젝트 E(엡실론) 알파 테스트 간단 후기 [9]
간단한 눈 처리 [4]
CUDA충돌처리 응용#2
2차 사내 스트레스 테스트 후기 [2]
해킨토시 설치 성공 [2]
DoF 결론 [2]
새로 구입한 책 Programmin Massively Parallel Processors [2]
CUDA로 계산하는 라이트맵
비러머글 맥스8 플러그인 위저드 설정 요령
win8 sdk에서 ddraw.lib 위치
64비트 포팅 프로젝트 진척상황
Project ε(프로젝트 엡실론) 2차 알파 동영상
프로젝트 엡실론 3차 알파 테스트 프리뷰 영상
nVidia Parallel NSight 소개
로그인 유지