第一章 FPGA異構(gòu)計算 1.1 異構(gòu)計算的發(fā)展 1.2 FPGA發(fā)展簡介 1.2.1 FPGA發(fā)展史 1.2.2 FPGA結(jié)構(gòu)的演變 第二章 OponCL基礎(chǔ) 2.1 OpenCL簡介 2.2 OpenCL模型 2.2.1 平臺模型 2.2.2 執(zhí)行模型 2.2.3 存儲模型 2.2.4 編程模型 2.3 OpenCL事件 2.3.1 命令事件 2.3.2 事件管理 2.3.3 用戶自定義事件 2.3.4 事件回調(diào) 2.3.5 進行評測 2.3.6 內(nèi)核事件 2.4 OpenCL同步 2.4.1 設(shè)備端同步 2.4.2 宿主機端同步 第三章 基于OpenCL的FPGA開發(fā)流程 3.1 搭建OpenCL開發(fā)環(huán)境 3.1.1 開發(fā)環(huán)境選擇 3.1.2 開發(fā)環(huán)境搭建流程 3.2 開發(fā)流程 3.2.1 建立FPGA工程 3.2.2 編寫源程序 3.2.3 調(diào)試內(nèi)核 3.2.4 內(nèi)核編譯及下載 3.2.5 工程配置及運行 第四章 FPGA的OpenCL實現(xiàn)機制 4.1 基于FPGA的異構(gòu)計算平臺 4.2 訪存機制 4.2.1 全局存儲 4.2.2 本地存儲 4.2.3 訪存聚合 4.2.4 訪存流化 4.3 調(diào)度與控制機制 4.3.1 同步機制 4.3.2 線程調(diào)度機制 4.3.3 迭代控制 4.3.4 分支跳轉(zhuǎn) 第五章 OpenCL程序優(yōu)化 5.1 數(shù)據(jù)傳輸優(yōu)化 5.2 存儲訪問優(yōu)化 5.2.1 全局訪存 5.2.2 本地訪存 5.3 數(shù)據(jù)處理優(yōu)化 5.3.1 多流水線 5.3.2 向量化 5.3.3 循環(huán)展開 5.3.4 平衡樹 5.4 其他優(yōu)化手段 5.4.1 運算精度 5.4.2 優(yōu)化的代碼風格 5.4.3 吞吐率 5.4.4 運算開銷 5.5 優(yōu)化流程 第六章 實現(xiàn)案例 6.1 矩陣乘法 6.1.1 初始內(nèi)核代碼 6.1.2 優(yōu)化過程 6.1.3 優(yōu)化結(jié)果分析 6.2 求解廣義逆矩陣 6.2.1 算法的實現(xiàn)結(jié)構(gòu) 6.2.2 優(yōu)化過程 6.2.3 優(yōu)化結(jié)果 6.3 圖像卷積 6.3.1 圖像卷積算法實現(xiàn)代碼 6.3.2 優(yōu)化過程 6.3.3 優(yōu)化結(jié)果 6.4 K-mcans聚類算法 6.4.1 算法的并行實現(xiàn) 6.4.2 運行結(jié)果分析 6.4.3 進一步優(yōu)化 附錄 參考文獻