본문 바로가기

CUDA Programming8

CUDA 프로그래밍 - CUDA 스레드 계층 CUDA 프로그래밍 - CUDA 스레드 계층 목차 CUDA 스레드 계층 구조 스레드 계층 내장 변수 그리드, 블록의 최대 크기 스레드 구조, 커널 호출 안녕하세요. 지난 포스팅에서 CUDA 프로그램을 활용해 벡터의 합을 구하는 예제를 다뤘습니다. 호스트와 디바이스 메모리 간 데이터 복사, 각 원소의 합을 구하는 커널 함수를 작성했습니다. 또한, 연산 시간을 측정하기 위한 간단한 코드도 작성해 봤습니다. 해당 내용이 궁금하시면 지난 글을 참고해 보시길 추천드립니다. CUDA 프로그래밍 - 벡터의 합 구하기 CUDA 프로그래밍 - 벡터의 합 구하기 목차 벡터의 합 구하기 CUDA 알고리즘 성능 측정 벡터 합 예제 전체 코드 안녕하세요. 지난 시간까지 CUDA 프로그래밍에서 제공하는 기초 메모리 API에 대해.. 2024. 3. 19.
CUDA 프로그래밍 - 벡터의 합 구하기(1) CUDA 프로그래밍 - 벡터의 합 구하기(1) 목차 벡터의 합 구하기 CUDA 알고리즘 성능 측정 벡터 합 예제 전체 코드 안녕하세요. 지난 시간까지 CUDA 프로그래밍에서 제공하는 기초 메모리 API에 대해 알아봤습니다. 해당 내용이 궁금하시면 이전 글을 참고하시는 것을 추천드립니다. 오늘은 이어서 병렬 연산에 대해 알아보고 벡터의 합을 구하는 프로그램을 작성하도록 하겠습니다. CUDA 프로그래밍 - 기초 메모리 API(1) CUDA 프로그래밍 - 기초 메모리 API(1) 목차 CUDA 프로그램 연산 흐름 CUDA 기초 메모리 API (할당, 초기화, 해제) CUDA 프로그램 연산 흐름 CUDA 프로그램은 호스트 코드와 디바이스 코드로 구성되어 있습 kudositdaily.tistory.com 벡터의 .. 2024. 3. 14.
CUDA 프로그래밍 - 기초 메모리 API(2) CUDA 프로그래밍 - 기초 메모리 API(2) 목차 CUDA 기초 메모리 API (호스트, 디바이스 데이터 복사) 호스트, 디바이스 간 데이터 복사 예제 안녕하세요. 지난 포스팅에서 CUDA 프로그램의 기본 연산 흐름과 디바이스(GPU) 메모리를 사용하기 위한 기초 API에 대해 소개했습니다. 이번 포스팅에서는 지난 글에 이어 호스트, 디바이스 간 데이터를 복사하는 방법에 대해 소개합니다. 지난 내용을 확인하고 싶으시면 아래의 글을 읽어보시는 것을 추천드립니다! CUDA 프로그래밍 - 기초 메모리 API(1) CUDA 프로그래밍 - 기초 메모리 API(1) 목차 CUDA 프로그램 연산 흐름 CUDA 기초 메모리 API (할당, 초기화, 해제) CUDA 프로그램 연산 흐름 CUDA 프로그램은 호스트 코드.. 2024. 3. 10.
CUDA 프로그래밍 - 기초 메모리 API(1) CUDA 프로그래밍 - 기초 메모리 API(1) 목차 CUDA 프로그램 연산 흐름 CUDA 기초 메모리 API (할당, 초기화, 해제) CUDA 프로그램 연산 흐름 CUDA 프로그램은 호스트 코드와 디바이스 코드로 구성되어 있습니다. 호스트 코드는 프로그램의 기본 연산을 수행하고, GPU와 같은 장치를 사용할 때, 커널을 호출합니다. 컴퓨터 시스템의 기본 메모리 공간은 CPU가 사용하는 시스템 메모리(system memory)입니다. 시스템 메모리는 일반적으로 메인보드에 장착되어 있는 DRAM 영역으로 메인 메모리(main memory)라고도 하고, CUDA 프로그램 관점에서 호스트 메모리로 지칭합니다. CPU와 GPU는 서로 독립된 장치로, 사용하는 메모리 영역이 다릅니다. GPU가 사용하는 메모리는 .. 2024. 3. 9.