ONNX Runtime WebGPU PR Monitor

Last Updated: 05/15/2026, 07:31 PM | Total: 238 PRs

Showing 1-10 of 42 PRs
Page 1 of 5
👤 edgchen1📅 Created: 05/15/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU plugin EP] Add Win ARM64 Python package",主要修改了 5 个文件,涉及 tools 等模块。代码变更包括 74 行新增和 60 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (5 files, 134 changes: +74/-60)
tools/ci_build/github/azure-pipelines/plugin-webgpu-test-pipeline.yml
tools/ci_build/github/azure-pipelines/stages/plugin-mac-webgpu-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-win-webgpu-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-win-webgpu-test-stage.yml
tools/ci_build/github/linux/build_webgpu_plugin_package.sh
👤 edgchen1📅 Created: 05/15/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU plugin EP] Package improvements",主要修改了 13 个文件,涉及 plugin-ep-webgpu 等模块。代码变更包括 88 行新增和 32 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (13 files, 120 changes: +88/-32)
plugin-ep-webgpu/_packaging_utils.py
plugin-ep-webgpu/csharp/Microsoft.ML.OnnxRuntime.EP.WebGpu/Microsoft.ML.OnnxRuntime.EP.WebGpu.csproj
plugin-ep-webgpu/csharp/Microsoft.ML.OnnxRuntime.EP.WebGpu/WebGpuEp.cs
plugin-ep-webgpu/csharp/README.md
plugin-ep-webgpu/csharp/pack_nuget.py
plugin-ep-webgpu/csharp/test/WebGpuEpNuGetTest/Program.cs
plugin-ep-webgpu/python/README.md
plugin-ep-webgpu/python/build_wheel.py
plugin-ep-webgpu/python/onnxruntime_ep_webgpu/__init__.py
plugin-ep-webgpu/python/pyproject.toml.in
plugin-ep-webgpu/python/requirements-build-wheel.txt
plugin-ep-webgpu/python/setup.py
plugin-ep-webgpu/python/test/test_webgpu_plugin_ep.py
👤 qjia7📅 Created: 05/15/2026
🤖 AI 摘要

本 PR 标题为"webgpu: Generalize FlashAttention prefill shared-memory path",主要修改了 3 个文件,涉及 onnxruntime 等模块。代码变更包括 13 行新增和 11 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (3 files, 24 changes: +13/-11)
onnxruntime/contrib_ops/webgpu/bert/flash_attention.cc
onnxruntime/contrib_ops/webgpu/bert/flash_attention.h
onnxruntime/contrib_ops/webgpu/bert/flash_attention.wgsl.template
🤖 AI 摘要

本 PR 标题为"[WebGPU] LinearAttention: increase tile_v when subgroups are available",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 12 行新增和 11 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (2 files, 23 changes: +12/-11)
onnxruntime/contrib_ops/webgpu/bert/linear_attention.cc
onnxruntime/contrib_ops/webgpu/bert/linear_attention.wgsl.template
🤖 AI 摘要

本 PR 标题为"Derive ORT_TEST_VERBOSE from System.Debug via runtime coalesce in plugin test pipelines",主要修改了 7 个文件,涉及 tools 等模块。代码变更包括 13 行新增和 5 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (7 files, 18 changes: +13/-5)
tools/ci_build/github/azure-pipelines/plugin-cuda-test-pipeline.yml
tools/ci_build/github/azure-pipelines/plugin-webgpu-test-pipeline.yml
tools/ci_build/github/azure-pipelines/stages/plugin-linux-cuda-test-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-linux-webgpu-test-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-mac-webgpu-test-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-win-cuda-test-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-win-webgpu-test-stage.yml
👤 xiaofeihan1📅 Created: 05/14/2026
🤖 AI 摘要

本 PR 标题为"[webgpu] Add NTC layout support for CausalConvWithState",主要修改了 6 个文件,涉及 onnxruntime 等模块。代码变更包括 102 行新增和 32 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (6 files, 134 changes: +102/-32)
onnxruntime/contrib_ops/cpu/bert/causal_conv_with_state.cc
onnxruntime/contrib_ops/cuda/bert/causal_conv_with_state.cc
onnxruntime/contrib_ops/webgpu/bert/causal_conv_with_state.cc
onnxruntime/contrib_ops/webgpu/bert/causal_conv_with_state.h
onnxruntime/contrib_ops/webgpu/bert/causal_conv_with_state.wgsl.template
onnxruntime/core/graph/contrib_ops/bert_defs.cc
ep:WebGPU
👤 feich-ms📅 Created: 05/14/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Add opset 24 support and Gemma 4 GQA enhancements",主要修改了 7 个文件,涉及 onnxruntime 等模块。代码变更包括 265 行新增和 20 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (7 files, 285 changes: +265/-20)
onnxruntime/contrib_ops/webgpu/bert/attention_common.h
onnxruntime/contrib_ops/webgpu/bert/flash_attention.cc
onnxruntime/contrib_ops/webgpu/bert/group_query_attention.cc
onnxruntime/core/providers/webgpu/tensor/cast.cc
onnxruntime/core/providers/webgpu/tensor/shape_op.cc
onnxruntime/core/providers/webgpu/webgpu_execution_provider.cc
onnxruntime/test/contrib_ops/group_query_attention_op_test.cc
ep:WebGPU
🤖 AI 摘要

本 PR 标题为"Implement staged CI pipeline: Linux CPU → Linux CUDA → everything else",主要修改了 29 个文件,涉及 .github 等模块。代码变更包括 287 行新增和 184 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (29 files, 471 changes: +287/-184)
.github/workflows/android.yml
.github/workflows/ios.yml
.github/workflows/linux-wasm-ci-build-and-test-workflow.yml
.github/workflows/linux_cuda_ci.yml
.github/workflows/linux_cuda_plugin_ci.yml
.github/workflows/linux_minimal_build.yml
.github/workflows/linux_openvino_ci.yml
.github/workflows/linux_tensorrt_ci.yml
.github/workflows/linux_webgpu.yml
.github/workflows/mac.yml
.github/workflows/macos-ci-build-and-test-workflow.yml
.github/workflows/react_native.yml
.github/workflows/reusable_linux_build.yml
.github/workflows/web.yml
.github/workflows/windows_build_x64_asan.yml
.github/workflows/windows_cuda.yml
.github/workflows/windows_cuda_plugin.yml
.github/workflows/windows_dml.yml
.github/workflows/windows_gpu_doc_gen.yml
.github/workflows/windows_openvino.yml
.github/workflows/windows_qnn_x64.yml
.github/workflows/windows_tensorrt.yml
.github/workflows/windows_webgpu.yml
.github/workflows/windows_x64_debug_build_x64_debug.yml
.github/workflows/windows_x64_release_build_x64_release.yml
.github/workflows/windows_x64_release_ep_generic_interface_build_x64_release_ep_generic_interface.yml
.github/workflows/windows_x64_release_vitisai_build_x64_release.yml
.github/workflows/windows_x64_release_xnnpack.yml
.github/workflows/windows_x86.yml
👤 hariharans29📅 Created: 05/12/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Fuse Q/K RMSNorm into GroupQueryAttention for Qwen3-style models",主要修改了 15 个文件,涉及 onnxruntime、js 等模块。代码变更包括 1072 行新增和 43 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (15 files, 1115 changes: +1072/-43)
js/web/lib/wasm/jsep/webgpu/ops/group-query-attention.ts
onnxruntime/contrib_ops/cpu/bert/group_query_attention.cc
onnxruntime/contrib_ops/cuda/bert/group_query_attention.cc
onnxruntime/contrib_ops/webgpu/bert/group_query_attention.cc
onnxruntime/contrib_ops/webgpu/bert/group_query_attention.h
onnxruntime/contrib_ops/webgpu/bert/rotary_embedding.cc
onnxruntime/contrib_ops/webgpu/bert/rotary_embedding.h
onnxruntime/core/graph/contrib_ops/bert_defs.cc
onnxruntime/core/optimizer/graph_transformer_utils.cc
onnxruntime/core/optimizer/group_query_attention_pre_norm_fusion.cc
onnxruntime/core/optimizer/group_query_attention_pre_norm_fusion.h
onnxruntime/core/providers/webgpu/math/unary_elementwise_ops.h
onnxruntime/core/providers/webgpu/nn/layer_norm.cc
onnxruntime/core/providers/webgpu/nn/layer_norm.h
onnxruntime/test/optimizer/group_query_attention_pre_norm_fusion_test.cc
ep:WebGPU
👤 xhcao📅 Created: 05/09/2026
🤖 AI 摘要

本 PR 标题为"webgpu: support vec2 type for gemm-subgroup",主要修改了 7 个文件,涉及 onnxruntime 等模块。代码变更包括 57 行新增和 48 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (7 files, 105 changes: +57/-48)
onnxruntime/core/providers/webgpu/math/matmul.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm.h
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm_subgroup.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm_subgroup.h
onnxruntime/core/providers/webgpu/vendor/intel/math/matmul.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/matmul.h
ep:WebGPU