本 PR 标题为"webgpu: fix GQA batched right-padded prefill with do_rotary",主要修改了 6 个文件,涉及 onnxruntime 等模块。代码变更包括 205 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU] Graph capture support for KV-shared decoder models",主要修改了 5 个文件,涉及 onnxruntime 等模块。代码变更包括 204 行新增和 5 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Fix WebGPU ConvTranspose incorrect output for fp16 models (output spatial dim > 2048)",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 4 行新增和 4 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Add Execution Provider conformance test suite",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 261 行新增和 0 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Add flash attention for non-quantized CPU GroupQueryAttention",主要修改了 6 个文件,涉及 onnxruntime、docs、cmake 等模块。代码变更包括 1052 行新增和 5 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU] Enable graph capture for Gemma4-class decoder models",主要修改了 13 个文件,涉及 onnxruntime 等模块。代码变更包括 930 行新增和 41 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Fix: Add CMake package files to Windows artifact #28468",主要修改了 1 个文件,涉及 tools 等模块。代码变更包括 111 行新增和 50 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU] Make max_num_pending_dispatches configurable",主要修改了 5 个文件,涉及 onnxruntime 等模块。代码变更包括 62 行新增和 1 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Lower CUDA plugin EP minimum ORT version to 1.24.4 with version-gated callbacks",主要修改了 16 个文件,涉及 onnxruntime、cmake、docs 等模块。代码变更包括 230 行新增和 59 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Fix stale output shape metadata in WebGPU external-data E2E model",主要修改了 3 个文件,涉及 js、onnxruntime 等模块。代码变更包括 7 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。