이놈의 충돌처리가 단순 연산만으로 작동하는게 아니고 케이스 바이 케이스로 처리할게 많아서 분기가 많다. 그러다보니 병렬화가 어렵다. 나름 죽도록 병렬화 했다고 생각하는데 실제 코드의 50%정도밖에 병렬화가 안되는것 같다.
코드 최적화는 할만큼 한거 같고 나머지는 GPU스펙에 달린듯.
이하는 NV Visual Profiler로 돌린 화면.
컴퓨팅 활용도 72.4%면 할만큼 했다고 생각한다. 매트릭스 연산이나 영상처리가 아닌지라 더 이상은 무리.
프로젝트 E(엡실론) 알파테스트 동영상 [4]
NVIDIA Parallel Nsight 2.2 RC1 릴리즈 [2]
nVidia Parallel NSight 소개
프로젝트 엡실론 3차 알파 테스트 프리뷰 영상
Project ε(프로젝트 엡실론) 2차 알파 동영상
64비트 포팅 프로젝트 진척상황
비러머글 맥스8 플러그인 위저드 설정 요령
CUDA로 계산하는 라이트맵
새로 구입한 책 Programmin Massively Parallel Processors [2]
DoF 결론 [2]
해킨토시 설치 성공 [2]
2차 사내 스트레스 테스트 후기 [2]
CUDA충돌처리 응용#2
간단한 눈 처리 [4]
유져모드 메모리 페이징 구현
가칭 프로젝트 E(엡실론) 알파 테스트 간단 후기 [9]
새로 만든 서버용 네트웍 컴포넌트 I4DyuchiNET2.0 [2]
TFS Backup Plan 삭제 방법
nVidia Visual Profiler 4.1로 돌린 결과
사내 스트레스 테스트 [16]
로그인 유지