Home Page Product 課程介紹 專業教育訓練課程 【課程二】NVIDIA CUDA TM圖形處理器高速平行運算 課程
Search By Category
Search By Keyword
專業教育訓練課程
Product Name
【課程二】NVIDIA CUDA TM圖形處理器高速平行運算 課程
Model
T052
Product Specification

近年來,GPGPU(General-Purpose computing on Graphics Processing Units)的計算理念已然成熟,加上半導體技術的迅速成長,至今在單一圖形處理晶片中,處理器核心(processor core)的個數已增加到3,840;所提供每秒單精度浮點運算次數可達10.6 TFLOPS(Tera FLoating-point Operations Per Second);在眾多科學計算(scientific computing)領域中所發表的論文早已證明其加速運算的強大效能,因此運用GPGPU來實現各領域的研究已成為目前及未來的研發趨勢。


為了使圖形處理器的運算能夠快速普及化,繪圖晶片供應商 NVIDIA 在 2007 年推出一免費的圖形處理器程式開發工具 CUDA (Compute Unified Device Architecture),使其客戶可以在通用圖形處理器 (GPGPU) 上任意開發各類的科學運算。具有高度運算需求之科學領域包括:人工智慧 (Artificial Intelligence)、機器學習 (Machine Learning)、深度學習 (Deep Learning)、影音3D多媒體、生物醫學、國防科學、石油探勘、財務工程、土木建築、電腦輔助製造(CAM: Computer Aided Manufacturing)、計算機輔助工程(CAE: Computer Aided Engineering)、電腦輔助設計(CAD:Computer Aided Design)、氣體煙霧模擬、火焰模擬、模流水流模擬等。可知半導體製程的快速進步使得圖形處理器的計算能力跟著快速成長,並且隨著圖形處理器程式開發工具CUDATM的越趨成熟,更加速超高速運算新紀元時代的來臨。


本課程的最大目標是引導 CUDA 初學者能夠在短時間內快速進入 CUDA 的平行世界。首先從 CUDA 的基礎平行計算模式開始介紹,針對在撰寫 CUDA 平行程式時,使用特殊記憶體該注意的事項、大量資料在平行處理時的各種切割方式、從多執行緒(multiple threads)到多 GPU 處理核心的分配方法、甚至於跨越多 GPU 晶片(multiple GPUs)的多串流(multiple streams)處理等議題,都是本課程要探討的內容;此外,正值 CUDA 8.0、Tesla P100 及 NVIDIA DGX-1 Deep Learning Supercomputer 等新功能發表期間,本課程也將搶先介紹其支援的新架構及新技術。為了加強學習的效果,本課程的安排特別著重於由淺而深,逐步引導學員從理解進而可以最快的速度上手 CUDA 平行程式的設計。只要是具備有 C 程式語言的設計基礎者均可參加此課程,利用兩天的時間快速學會 CUDA 平行處理程式的設計技巧及目前最新平行理念。


誠摯的邀請您來參加這場不能錯過的 CUDA 訓練課程:

※上課時間 :歡迎機關團體或個人隨時來電洽詢。

基礎 :具備有 C 程式語言的設計基礎者均可參加此課程。

  

【課程內容表】

 

授課講師
兌全有限公司 專任講師
第一天  議 程 內     容
8:30~9:00 報     到
9:00~10:50
1.CUDA SDK 8.0, Tesla P100 圖形處理器架構及計算能力簡介
2.Thread, thread block, grid, warp 等平行計算模式概念說明
3.程式追蹤(一): 簡單的 CUDA 平行程式開發
10:50~11:00 休息時間
11:00~12:00
4.GPU Global, constant, shared 記憶體的階層概念及使用方法說明
  • 程式追蹤(二): 使用 CUDA 記憶體加速平行計算
12:00~13:00 午餐時間
13:00~14:20
5.CUDA 程式的效能評估方法
  • 程式追蹤(三): 在平行程式中加入計時器評估
14:20~14:30 休息時間
14:30~16:00
6.個案研究 A : N Body 計算
  • 程式追蹤(四): N Body 平行計算
16:00~16:10 休息時間
16:10~17:00
7.個案研究 B : Monte Carlo 及 Random Number Generation 計算
  • 程式追蹤(五): Monte Carlo 平行計算
  賦    歸

 

 

授課講師
兌全有限公司 專任講師
第二天  議 程內     容
8:30~9:00報     到
9:00~10:5
1.NVIDIA DGX-1 Deep Learning Supercomputer 簡介
2.NVLink High Speed Interconnect 簡介
3.平行 streams及操控Multiple GPUs的使用方法
4.程式追蹤(六): 使用 multiple streams 設計平行程
10:50~11:00休息時間
11:00~12:005.程式追蹤(七): Multiple GPUs 平行程式開發
12:00~13:00午餐時間
13:00~14:206.CUDA Texture 及 Surface 記憶體的使用方式
14:20~14:30休息時間
14:30~16:007.程式追蹤(八): Image Sobel filtering and Rotation
16:00~16:10休息時間
16:10~17:008.GPUDirect Peer-to-peer Transfers 及 Unified Virtual Addressing
 賦    歸

 

【資訊內容】

 

 



File Download

 

 

GPU123 Technology Co., Ltd.
Tel : +886 3301 9583  Fax : +886 3 301 9045
地址:
4F. -1, No. 67, Sec. 2, Daxing W. Rd. Taoyuan City, Taoyuan County  33046, Taiwan (R. 0. C. )    
    

 

Designed by ezb2b2c