본문 바로가기

CUDA 프로그래밍11

CUDA 프로그래밍 - 벡터의 합 구하기(2) CUDA 프로그래밍 - 벡터의 합 구하기(2) 목차 벡터의 합을 위한 스레드 레이아웃 벡터의 합 예제 코드 '벡터의 합 구하기' 포스팅에서 CUDA 프로그램을 작성해서 벡터의 합을 구했습니다. 당시 구현한 예제 프로그램은 최대 1,024개의 스레드를 활용해 병렬적으로 벡터의 합을 계산했습니다. 사용하는 스레드가 제한적이기 때문에 병렬 컴퓨팅의 능력을 제대로 발휘하지 못했고, 1024개의 스레드를 초과했을 때, 커널이 제대로 연산을 수행하지 못했습니다. 오늘 포스팅에서는 지난 포스팅에서 다룬 스레드 계층을 활용해서 더 큰 규모의 벡터의 합을 구해보도록 하겠습니다. CUDA 프로그래밍 - 벡터의 합 구하기(1) CUDA 프로그래밍 - 벡터의 합 구하기(1) 목차 벡터의 합 구하기 CUDA 알고리즘 성능 측정.. 2024. 3. 22.
CUDA 프로그래밍 - CUDA 스레드 계층 CUDA 프로그래밍 - CUDA 스레드 계층 목차 CUDA 스레드 계층 구조 스레드 계층 내장 변수 그리드, 블록의 최대 크기 스레드 구조, 커널 호출 안녕하세요. 지난 포스팅에서 CUDA 프로그램을 활용해 벡터의 합을 구하는 예제를 다뤘습니다. 호스트와 디바이스 메모리 간 데이터 복사, 각 원소의 합을 구하는 커널 함수를 작성했습니다. 또한, 연산 시간을 측정하기 위한 간단한 코드도 작성해 봤습니다. 해당 내용이 궁금하시면 지난 글을 참고해 보시길 추천드립니다. CUDA 프로그래밍 - 벡터의 합 구하기 CUDA 프로그래밍 - 벡터의 합 구하기 목차 벡터의 합 구하기 CUDA 알고리즘 성능 측정 벡터 합 예제 전체 코드 안녕하세요. 지난 시간까지 CUDA 프로그래밍에서 제공하는 기초 메모리 API에 대해.. 2024. 3. 19.
CUDA 프로그래밍 - 벡터의 합 구하기(1) CUDA 프로그래밍 - 벡터의 합 구하기(1) 목차 벡터의 합 구하기 CUDA 알고리즘 성능 측정 벡터 합 예제 전체 코드 안녕하세요. 지난 시간까지 CUDA 프로그래밍에서 제공하는 기초 메모리 API에 대해 알아봤습니다. 해당 내용이 궁금하시면 이전 글을 참고하시는 것을 추천드립니다. 오늘은 이어서 병렬 연산에 대해 알아보고 벡터의 합을 구하는 프로그램을 작성하도록 하겠습니다. CUDA 프로그래밍 - 기초 메모리 API(1) CUDA 프로그래밍 - 기초 메모리 API(1) 목차 CUDA 프로그램 연산 흐름 CUDA 기초 메모리 API (할당, 초기화, 해제) CUDA 프로그램 연산 흐름 CUDA 프로그램은 호스트 코드와 디바이스 코드로 구성되어 있습 kudositdaily.tistory.com 벡터의 .. 2024. 3. 14.
CUDA 프로그래밍 - 기초 메모리 API(2) CUDA 프로그래밍 - 기초 메모리 API(2) 목차 CUDA 기초 메모리 API (호스트, 디바이스 데이터 복사) 호스트, 디바이스 간 데이터 복사 예제 안녕하세요. 지난 포스팅에서 CUDA 프로그램의 기본 연산 흐름과 디바이스(GPU) 메모리를 사용하기 위한 기초 API에 대해 소개했습니다. 이번 포스팅에서는 지난 글에 이어 호스트, 디바이스 간 데이터를 복사하는 방법에 대해 소개합니다. 지난 내용을 확인하고 싶으시면 아래의 글을 읽어보시는 것을 추천드립니다! CUDA 프로그래밍 - 기초 메모리 API(1) CUDA 프로그래밍 - 기초 메모리 API(1) 목차 CUDA 프로그램 연산 흐름 CUDA 기초 메모리 API (할당, 초기화, 해제) CUDA 프로그램 연산 흐름 CUDA 프로그램은 호스트 코드.. 2024. 3. 10.