본문 바로가기

엔비디아5

CUDA 프로그래밍 - 벡터의 합 구하기(2) CUDA 프로그래밍 - 벡터의 합 구하기(2) 목차 벡터의 합을 위한 스레드 레이아웃 벡터의 합 예제 코드 '벡터의 합 구하기' 포스팅에서 CUDA 프로그램을 작성해서 벡터의 합을 구했습니다. 당시 구현한 예제 프로그램은 최대 1,024개의 스레드를 활용해 병렬적으로 벡터의 합을 계산했습니다. 사용하는 스레드가 제한적이기 때문에 병렬 컴퓨팅의 능력을 제대로 발휘하지 못했고, 1024개의 스레드를 초과했을 때, 커널이 제대로 연산을 수행하지 못했습니다. 오늘 포스팅에서는 지난 포스팅에서 다룬 스레드 계층을 활용해서 더 큰 규모의 벡터의 합을 구해보도록 하겠습니다. CUDA 프로그래밍 - 벡터의 합 구하기(1) CUDA 프로그래밍 - 벡터의 합 구하기(1) 목차 벡터의 합 구하기 CUDA 알고리즘 성능 측정.. 2024. 3. 22.
CUDA 프로그래밍 - CUDA 스레드 계층 CUDA 프로그래밍 - CUDA 스레드 계층 목차 CUDA 스레드 계층 구조 스레드 계층 내장 변수 그리드, 블록의 최대 크기 스레드 구조, 커널 호출 안녕하세요. 지난 포스팅에서 CUDA 프로그램을 활용해 벡터의 합을 구하는 예제를 다뤘습니다. 호스트와 디바이스 메모리 간 데이터 복사, 각 원소의 합을 구하는 커널 함수를 작성했습니다. 또한, 연산 시간을 측정하기 위한 간단한 코드도 작성해 봤습니다. 해당 내용이 궁금하시면 지난 글을 참고해 보시길 추천드립니다. CUDA 프로그래밍 - 벡터의 합 구하기 CUDA 프로그래밍 - 벡터의 합 구하기 목차 벡터의 합 구하기 CUDA 알고리즘 성능 측정 벡터 합 예제 전체 코드 안녕하세요. 지난 시간까지 CUDA 프로그래밍에서 제공하는 기초 메모리 API에 대해.. 2024. 3. 19.
CUDA 프로그래밍 - 벡터의 합 구하기(1) CUDA 프로그래밍 - 벡터의 합 구하기(1) 목차 벡터의 합 구하기 CUDA 알고리즘 성능 측정 벡터 합 예제 전체 코드 안녕하세요. 지난 시간까지 CUDA 프로그래밍에서 제공하는 기초 메모리 API에 대해 알아봤습니다. 해당 내용이 궁금하시면 이전 글을 참고하시는 것을 추천드립니다. 오늘은 이어서 병렬 연산에 대해 알아보고 벡터의 합을 구하는 프로그램을 작성하도록 하겠습니다. CUDA 프로그래밍 - 기초 메모리 API(1) CUDA 프로그래밍 - 기초 메모리 API(1) 목차 CUDA 프로그램 연산 흐름 CUDA 기초 메모리 API (할당, 초기화, 해제) CUDA 프로그램 연산 흐름 CUDA 프로그램은 호스트 코드와 디바이스 코드로 구성되어 있습 kudositdaily.tistory.com 벡터의 .. 2024. 3. 14.
CUDA 프로그래밍 - Hello CUDA! (Linux) CUDA 프로그래밍 - Hello CUDA! (Linux) 목차 Linux 환경 CUDA 툴킷 설치하기 Hello CUDA! 안녕하세요! 지난 포스팅에서는 처음으로 CUDA 프로젝트를 생성하고, 빌드 및 실행했습니다. 이전 글에서 윈도우 비주얼 스튜디오 환경에서 Hello CUDA를 생성해 봤는데요. 이번 글에서는 말씀드린 것처럼 리눅스 환경에서 설정 후, Hello CUDA 프로젝트를 실습해 보도록 하겠습니다. CUDA 프로그래밍을 실행하기 전, 엔비디아 GPU, CUDA 호환성을 확인하는 방법, 원도우에서 CUDA 프로그래밍 환경을 설정하는 내용을 확인하고 싶으시면 아래의 글을 읽어보시는 것을 추천드립니다! CUDA 프로그래밍 - Hello CUDA! CUDA 프로그래밍 - Hello CUDA! 목차.. 2024. 3. 2.