前提:
- CPU: i5-4690 (规格参考)
- Bus Speed: 5 GT/s DMI2 (~= 4GB/s)
- Max Memory Bandwidth: 25.6GB/s
- GPU0: Intel HD Graphics 4600
- Pixel Fillrate: 4.8GPixel/s
- Texture Fillrate: 9.6GTexel/s
- Bus width: 128bit
- Bandwidth: 25.6GB/s
- OpenCL/DirectCompute 5.0
- Memory Size: 2 GB (来自内存共享)
- GPU1: Nvidia GTX 1060 (规格参考)
- Memory Size: 6 GB
- Bus width: 192 bit
- Bandwidth: 192.2 GB/s
- Pixel Rate: 82.03 GPixel/s
- Texture Rate: 136.7 GTexel/s
- 假设实际内存的总带宽为 25.6GB/s
- 显示的刷新率为 60Hz
- GL 渲染时,只考虑纹理的数据传输,忽略其他次要因素
- 假设 GL 的纹理使用 RGBAFormat
问题 1:用 GPU0 的 GL 中渲染动画(纹理),一帧所需要的数据量为 1GB(数据量(GB) = 纹理的宽 x 高 x 4 / Math.pow(1024,3) x 纹理的数量 ),那么此时的显卡带宽是不是不够用的?( 1GB/fps x 60fps > 25.6GB/s )
问题 2:用 GPU0 时,集显和显存(也就是内存)、显存和显示器之间的数据传输,带宽是否是纹理数据量的两倍?( 1GB/fps x 60fps x 2 )
问题 3:用 GPU0 时,渲染动画所需带宽为 20GB/s,小于 25.6GB/s,此时 CPU Bus Speed 是否会成为性能瓶颈?
问题 4:用 GPU0 测试时,Windows 10 任务管理器中 3D 占用约为 85%,共享 GPU 内存利用率约为 85%,内存占用约为 15GB/16GB,此时浏览器切换 Tab 再切回就会重载页面,这是由于内存带宽不足还是内存容量不足造成的?
问题 5:改用 GPU1 时,带宽是否够用?此时 CPU Bus Speed一定不会成为性能的瓶颈?
问题 6:GPU 的 Pixel Rate、Texture Rate、Bandwidth 之间有什么关系?
问题 7:GL 首次把纹理渲染后,后续执行动画(位移、旋转)时,纹理是重复渲染,还是会使用缓存的 frameBuffer?(实际上 frameBuffer 一直为 null )
以上如有错误之处,烦请指正。另外问问这方面的资料哪里可以找到