yuchi's Development Home


64비트 어셈에서 스택 사용시 주의사항

조회 수 3596 추천 수 168 2007.08.23 23:53:01
엔진과 기타 몇몇 컴포넌트에서 DPC(함수호출에 대한 내용을 일단 저장해두고 나중에 함수 호출)가 필요했기 때문에 꽤 오래전에 DPC 코드를 작성해서  공용 라이브러리 DLL에 넣어놨었다.

DPC(Deffrred Procedure Call)를 구현하기 위해서는 가변인자처리를 해야했고, 따라서 어셈블리코드를 반드시 써야만했다.

x64랑 x86이랑 calling convention이 달랐으므로 파라미터를 넘기는 부분에서 꽤 애먹었었다.

여튼 코드를 작성해서 지금까지 잘 사용하고 있었다(그렇다고 믿었다.)

몇일전에 그 DPC를 통해서 호출한 함수에서 OutputDebugString()함수가 오작동하는 것을 알게 됐다. 정확히는 First-Chance Exception, 대충 win32 함수 안에서 뭔가 문제가 생긴건 알겠는데...

이것만 가지곤 알수가 없잖아.

테스트 결과 OutputDebugString()뿐만 아니라 , 몇 개의 win32 api가 오작동하는 것을 발견했다. 그러니까 DPC를 통해서 호출될때에 한해서다.

눈을 부릅뜨고 더 테스트를 해보고 파라미터를 4개 이하로 넘길때는 win32함수들도 정상 작동하는 것을 알게 됐다.

파라미터가 4개 이하인 경우에는 rcx,rdx,r8,r9레지스터를 통해서 파라미터를 전달한다. 즉 리턴 어드레스를 적어넣는것 말고는 스택을 사용하지 않는다.

그렇다면?

문득 떠오르는게 있어서 문서를 열나게 뒤졌다.

msdn의 x64컨버젼 부분에서 스택은 16바이트 얼라인으로 간주한다는 내용 발견. 이런 쯧.

dpc를 통해서 함수를 호출할때 5개째의 파라미터 부터는 스택을 통해서 전달한다. 이때 파라미터 개수*8로 계산해서 스택 포인터를 뺐는데, 이렇게 되니 16바이트 얼라인 규칙이 무너진것이다.

일부 win32 api를 추적해보니 xmm레지스터도 사용하는 것을 확인했다.

xmm레지스터까지 사용한다면 속도를 위해서 16바이트 얼라인을 사용하는 것이 말이 된다.

16바이트 얼라인 되지 않은 메모리를 movaps등의 명령어로 억세스 하면 크래쉬 해버리니까.

여튼, 파라미터를 전달할때 스택 포인터를 16바이트 얼라인 시키는 코드를 추가했다.

과연...

잘 돌아간다.

코드 짜는데는 5분도 안걸렸는데 원인을 발견하는데까지는 반나절이 걸렸다.

반나절 고민 끝에 버그를 해결했으므로 깨달음을 얻었다. 렙업!

아아 프로그래밍의 세계는 역시 심오해.
List of Articles
번호 제목 글쓴이 날짜 조회 수sort

라이트맵 블러링 file

  • 여치
  • 2011-12-08
  • 조회 수 3639

dx11 첫 걸음 file

  • 여치
  • 2011-01-19
  • 조회 수 3629

최근 엔진 스샷 file [3]

  • 여치
  • 2008-01-25
  • 조회 수 3628

설 연휴기간 동안 작업내용

  • 여치
  • 2008-02-08
  • 조회 수 3624

프로그래밍의 도를 향해#3

  • 여치
  • 2002-04-22
  • 조회 수 3605

아이폰 프로그래밍 첫 연습작 file [2]

  • 여치
  • 2011-04-01
  • 조회 수 3604

64비트 어셈에서 스택 사용시 주의사항

  • 여치
  • 2007-08-23
  • 조회 수 3596

라이트맵 계산시에 Ambient Occlusion적용하기 file

  • 여치
  • 2011-08-27
  • 조회 수 3581

Project ε(프로젝트 엡실론) 2차 알파 후기 file [2]

  • 여치
  • 2010-06-03
  • 조회 수 3580

CUDA충돌처리 현재까지의 결과 CPU vs GPU file [4]

  • 여치
  • 2012-02-22
  • 조회 수 3569

DB에 세이브 기능 구현

  • 여치
  • 2008-02-02
  • 조회 수 3564

라이트맵 드로잉 기능이라면... file [1]

  • 여치
  • 2008-01-25
  • 조회 수 3555

CUDA 로컬 디버깅 설정 file

  • 여치
  • 2011-11-30
  • 조회 수 3551

레이어 기능을 추가한 하이트 필드 file [4]

  • 여치
  • 2005-07-01
  • 조회 수 3549

라이트맵 계산시에 Ambient Occlusion적용하기 #3 file [2]

  • 여치
  • 2011-08-31
  • 조회 수 3537

다이나믹 라이트 file

  • 여치
  • 2009-06-13
  • 조회 수 3524

Create .lib file from .dll file

  • 여치
  • 2013-02-02
  • 조회 수 3515

cuda로 필터 만들기 첫번째 B/W필터 file

  • 여치
  • 2010-04-15
  • 조회 수 3514

설 연휴 작업 내용 file

  • 여치
  • 2009-01-28
  • 조회 수 3502

BSP/PORTAL적용 결과 [4]

  • 여치
  • 2008-08-21
  • 조회 수 3500
天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet



XE Login

天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet