ONNX Runtime WebGPU PR Monitor

Last Updated: 06/24/2026, 07:51 PM | Total: 302 PRs

Showing 1-10 of 52 PRs
Page 1 of 6
🤖 AI 摘要

本 PR 标题为"webgpu: Enable FlashAttention for batched GQA with right-padded prompts",主要修改了 5 个文件,涉及 onnxruntime 等模块。代码变更包括 130 行新增和 74 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (5 files, 204 changes: +130/-74)
onnxruntime/contrib_ops/webgpu/bert/flash_attention.cc
onnxruntime/contrib_ops/webgpu/bert/flash_attention.h
onnxruntime/contrib_ops/webgpu/bert/flash_attention.wgsl.template
onnxruntime/contrib_ops/webgpu/bert/flash_attention_decode_qkv.wgsl.template
onnxruntime/contrib_ops/webgpu/bert/flash_attention_decode_vx_reduce.wgsl.template
🤖 AI 摘要

本 PR 标题为"Clamp derived sequence lengths and KV-cache index in CUDA GroupQueryAttention",主要修改了 3 个文件,涉及 onnxruntime 等模块。代码变更包括 113 行新增和 3 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (3 files, 116 changes: +113/-3)
onnxruntime/contrib_ops/cuda/bert/group_query_attention_impl.cu
onnxruntime/contrib_ops/cuda/bert/group_query_attention_qkv.cuh
onnxruntime/test/contrib_ops/group_query_attention_op_test.cc
👤 feich-ms📅 Created: 06/23/2026
🤖 AI 摘要

本 PR 标题为"WebGPU: Add indirect dispatch for flash attention graph capture",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 50 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (2 files, 57 changes: +50/-7)
onnxruntime/contrib_ops/webgpu/bert/flash_attention.cc
onnxruntime/contrib_ops/webgpu/bert/flash_attention.h
🤖 AI 摘要

本 PR 标题为"WebGPU: make WebGpuContextFactory::Cleanup exception-safe and idempotent",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 23 行新增和 6 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (1 files, 29 changes: +23/-6)
onnxruntime/core/providers/webgpu/webgpu_context.cc
👤 fanchenkong1📅 Created: 06/18/2026
🤖 AI 摘要

本 PR 标题为"Recover Conv/ConvTranspose rank from weight when input shape is unknown",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 11 行新增和 4 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (2 files, 115 changes: +111/-4)
onnxruntime/core/optimizer/layout_transformation/layout_transformation.cc
onnxruntime/test/optimizer/transpose_optimizer_test.cc
👤 Shivani767📅 Created: 06/16/2026
🤖 AI 摘要

本 PR 标题为"Add 2-bit quantization support to WebGPU GatherBlockQuantized operator",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 13 行新增和 4 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (2 files, 17 changes: +13/-4)
onnxruntime/contrib_ops/webgpu/moe/qmoe.h
onnxruntime/contrib_ops/webgpu/quantization/gather_block_quantized.cc
ep:WebGPU
👤 edgchen1📅 Created: 06/15/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU plugin EP] Update release and packaging-related docs",主要修改了 8 个文件,涉及 tools、plugin-ep-webgpu 等模块。代码变更包括 143 行新增和 57 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (8 files, 200 changes: +143/-57)
plugin-ep-webgpu/README.md
plugin-ep-webgpu/RELEASE.md
plugin-ep-webgpu/csharp/Microsoft.ML.OnnxRuntime.EP.WebGpu/README.md
plugin-ep-webgpu/csharp/README.md
plugin-ep-webgpu/python/README.md
plugin-ep-webgpu/python/onnxruntime_ep_webgpu/README.md
tools/ci_build/github/azure-pipelines/stages/plugin-webgpu-nuget-packaging-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-webgpu-packaging-stage.yml
👤 adrastogi📅 Created: 06/12/2026
🤖 AI 摘要

本 PR 标题为"Plugin WebGPU EP Branch: Update protobufjs versions",主要修改了 2 个文件,涉及 js 等模块。代码变更包括 120 行新增和 106 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (2 files, 226 changes: +120/-106)
js/node/package-lock.json
js/web/package-lock.json
🤖 AI 摘要

本 PR 标题为"Fix WebGPU ConvTranspose incorrect output for fp16 models (output spatial dim > 2048)",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 4 行新增和 4 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (1 files, 8 changes: +4/-4)
onnxruntime/core/providers/webgpu/nn/conv_backprop.cc
👤 GopalakrishnanN📅 Created: 06/09/2026
🤖 AI 摘要

本 PR 标题为"Add Execution Provider conformance test suite",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 261 行新增和 0 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (1 files, 261 changes: +261/-0)
onnxruntime/test/framework/execution_provider_conformance_test.cc