目录
一、使用交叉顶点数据
二、使用gl.drawElements()的索引绘制(geometry.index)
三、LOD
四、将CPU执行的操作移到GPU
五、减少绘制调用的次数
六、避免绘制时从GPU读回数据或状态
七、Merge合并几何体
八、InstanceMesh多实例
两种合并方式比较
一、使用交叉顶点数据
用一个数组交叉地保存顶点数据,而不是用独立的顶点数组保存不同的属性,会得到更好的性能,因为顶点数组具有更好的局部内存。例如,把顶点位置读入到变换前顶点缓存时,很可能会把该顶点的法线信息也读入到变换前的顶点缓存中,在需要时供顶点着色器使用。如下
var verticesColors = new Float32Array([ // 顶点坐标和颜色 0.0, 0.5, 1.0, 0.0, 0.0, -0.5, -0.5, 0.0, 1.0, 0.0, 0.5, -0.5, 0.0, 0.0, 1.0, ]); var n = 3; // 顶点数量 // 创建缓冲区对象 var vertexColorBuffer = gl.createBuffer(); gl.bindBuffer(gl.ARRAY_BUFFER, vertexColorBuffer); gl.bufferData(gl.ARRAY_BUFFER, verticesColors, gl.STATIC_DRAW); var FSIZE = verticesColors.BYTES_PER_ELEMENT; // 获取a_Position的存储位置,分配缓冲区并开启 var a_Position = gl.getAttribLocation(gl.program, 'a_Position'); gl.vertexAttribPointer(a_Position, 2, gl.FLOAT, false, FSIZE * 5, 0); gl.enableVertexAttribArray(a_Position); // 获取a_Color的存储位置,分配缓冲区并开启 var a_Color = gl.getAttribLocation(gl.program, 'a_Color'); gl.vertexAttribPointer(a_Color, 3, gl.FLOAT, false, FSIZE * 5, FSIZE * 2); gl.enableVertexAttribArray(a_Color);
二、使用gl.drawElements()的索引绘制(geometry.index)
宗旨:尽可能的减少顶点数量
const geometry = new THREE.BufferGeometry(); const vertices = new Float32Array([ 0, 0, 0, //顶点1坐标 80, 0, 0, //顶点2坐标 80, 80, 0, //顶点3坐标 0, 80, 0, //顶点4坐标 ]); // 创建属性缓冲区对象 const attribue = new THREE.BufferAttribute(vertices, 3); geometry.attributes.position = attribue; // Uint16Array类型数组创建顶点索引数据 const indexes = new Uint16Array([ 0, 1, 2, 0, 2, 3, ]) // BufferAttribute表示顶点索引属性的值 geometry.index = new THREE.BufferAttribute(indexes, 1); //1个为一组
三、LOD
细节层次LOD技术。当对象离开观察者的视线时可以降低模型的复杂度(随着相机距离增大,减少三角形的细分数)。实际上通常为模型创建不同的版本,在运行时进行改变。当然,在JavaScript代码中实现 LOD 逻辑会增加 CPU的工作量,因此存在这样的风险:如果不谨慎,可能会把瓶颈从 GPU 移到 CPU。
四、将CPU执行的操作移到GPU
充分发挥GPU的本领,避免CPU干的蒙圈,GPU一旁看着干捉急
如果只绘制少数几个对象,这并不很重要,因为JavaScript 引擎速度已经足够快。但是如果在每帧中需要绘制几千个对象,每个对象需要执行几次矩阵相乘运算,在用户属于CPU 受限的情况下,则这会很快使帧的速率恶化。
五、减少绘制调用的次数
任何对 WebGL API的调用都会带来开销。每个调用都会要求 CPU 进行额外的处理和数据复制,这会占用时间并要求 CPU做一些额外工作。通常,如果GPU接收到大批可并行处理的数据,运行效率会提高许多。
提高 WebGL性能的一个最重要建议是在每帧处理期间使调用gl.drawArays0和gl.drawElementsO的次数最少。例如,某个场景的一部分需要绘制 1000 个三角形,则调用两次gldrawArrays()或gl.drawElements()每次绘制 500个三角形,比调用100次每次绘制10个三角形更好。
六、避免绘制时从GPU读回数据或状态
最典型的就是 gl.readPixels()!!!获取颜色值!因为GPU中的流水线经常需要刷新,从 GPU 读回数据是一个相对较慢的操作,会消耗大量的时间和资源。特别是在每帧都需要读回数据时,会导致渲染性能急剧下降。另,将数据从 GPU 传输到 CPU 需要通过总线传输,这会消耗大量的带宽。频繁地读取数据将增加对内存和总线带宽的需求
/** * @param {*} gl webgl * @param {*} startPosition 开始点的坐标 * @param {*} rectangle 长宽的范围 * @returns */ function readPixelReturnInt(gl,startPosition,rectangle) { //像素容器 let pixel = new Uint8Array(rectangle[0]* rectangle[1] * 4); //抓取像素 gl.readPixels( startPosition[0], startPosition[1], rectangle[0], rectangle[1], gl.RGBA, gl.UNSIGNED_BYTE, pixel ) return pixel; }
七、Merge合并几何体
当有大量的几何体需要渲染时,可以将它们合并为一个几何体来减少渲染调用,从而提高性能。合并后的几何体将会生成一个大的缓冲区,包含了所有合并的几何体的数据,这样在渲染时只需一次性加载这个大缓冲区即可,减少了渲染调用和资源占用。
八、InstanceMesh多实例
instanceMesh 是使用InstancedMesh类来创建实例化的几何体。它适用于当需要大量重复的几何体时,但是每个实例之间有不同的变换属性(如位置、旋转、缩放等)。极大节省内存,只会存储一个geometry的顶点数据
两种合并方式比较
Instance实例化几何体 | Merge合并几何体 | |
---|---|---|
Material | 相同 | 相同 |
Geometry | 相同 | ✔ 不同 |
单个控制 | ✔ 使用索引,轻松实现 | 着色器实现 |
生成时间 | ✔ 快速 | 缓慢 |
渲染性能 | 较优 | ✔ 更优 |
内存占用 | ✔ 极少 | 较多 |
还没有评论,来说两句吧...