近年來,GPGPU(General-Purpose computing on Graphics Processing Units)的計算理念已然成熟,加上半導體技術的迅速成長,至今在單一圖形處理晶片中,處理器核心(processor core)的個數已增加到3,840;所提供每秒單精度浮點運算次數可達10.6 TFLOPS(Tera FLoating-point Operations Per Second);在眾多科學計算(scientific computing)領域中所發表的論文早已證明其加速運算的強大效能,因此運用GPGPU來實現各領域的研究已成為目前及未來的研發趨勢。
為了使圖形處理器的運算能夠快速普及化,繪圖晶片供應商 NVIDIA 在 2007 年推出一免費的圖形處理器程式開發工具 CUDA (Compute Unified Device Architecture),使其客戶可以在通用圖形處理器 (GPGPU) 上任意開發各類的科學運算。具有高度運算需求之科學領域包括:人工智慧 (Artificial Intelligence)、機器學習 (Machine Learning)、深度學習 (Deep Learning)、影音3D多媒體、生物醫學、國防科學、石油探勘、財務工程、土木建築、電腦輔助製造(CAM: Computer Aided Manufacturing)、計算機輔助工程(CAE: Computer Aided Engineering)、電腦輔助設計(CAD:Computer Aided Design)、氣體煙霧模擬、火焰模擬、模流水流模擬等。可知半導體製程的快速進步使得圖形處理器的計算能力跟著快速成長,並且隨著圖形處理器程式開發工具CUDATM的越趨成熟,更加速超高速運算新紀元時代的來臨。
本課程的最大目標是引導 CUDA 初學者能夠在短時間內快速進入 CUDA 的平行世界。首先從 CUDA 的基礎平行計算模式開始介紹,針對在撰寫 CUDA 平行程式時,使用特殊記憶體該注意的事項、大量資料在平行處理時的各種切割方式、從多執行緒(multiple threads)到多 GPU 處理核心的分配方法、甚至於跨越多 GPU 晶片(multiple GPUs)的多串流(multiple streams)處理等議題,都是本課程要探討的內容;此外,正值 CUDA 8.0、Tesla P100 及 NVIDIA DGX-1 Deep Learning Supercomputer 等新功能發表期間,本課程也將搶先介紹其支援的新架構及新技術。為了加強學習的效果,本課程的安排特別著重於由淺而深,逐步引導學員從理解進而可以最快的速度上手 CUDA 平行程式的設計。只要是具備有 C 程式語言的設計基礎者均可參加此課程,利用兩天的時間快速學會 CUDA 平行處理程式的設計技巧及目前最新平行理念。
誠摯的邀請您來參加這場不能錯過的 CUDA 訓練課程:
※上課時間 :歡迎機關團體或個人隨時來電洽詢。
※基礎 :具備有 C 程式語言的設計基礎者均可參加此課程。
Designed by ezb2b2c