ONNX Runtime WebGPU PR Monitor

Last Updated: 05/18/2026, 07:46 PM | Total: 240 PRs

Showing 1-10 of 42 PRs
Page 1 of 5
👤 Lingavasan📅 Created: 05/17/2026
🤖 AI 摘要

本 PR 标题为"Reserve WebGPU program vector capacity",主要修改了 5 个文件,涉及 onnxruntime 等模块。代码变更包括 48 行新增和 1 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (5 files, 49 changes: +48/-1)
onnxruntime/core/providers/webgpu/nn/conv.cc
onnxruntime/core/providers/webgpu/nn/conv2d_mm.cc
onnxruntime/core/providers/webgpu/program.cc
onnxruntime/core/providers/webgpu/program.h
onnxruntime/core/providers/webgpu/program_test.cc
👤 HectorSVC📅 Created: 05/16/2026
🤖 AI 摘要

本 PR 标题为"Update GatherBlockQuantized to support 2-bits",主要修改了 6 个文件,涉及 onnxruntime、docs 等模块。代码变更包括 253 行新增和 22 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (6 files, 326 changes: +300/-26)
docs/ContribOperators.md
onnxruntime/contrib_ops/cpu/quantization/gather_block_quantized.cc
onnxruntime/contrib_ops/webgpu/quantization/gather_block_quantized.cc
onnxruntime/contrib_ops/webgpu/quantization/gather_block_quantized.h
onnxruntime/core/graph/contrib_ops/contrib_defs.cc
onnxruntime/test/contrib_ops/gather_block_quantized_op_test.cc
👤 edgchen1📅 Created: 05/15/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU plugin EP] Add Win ARM64 Python package",主要修改了 5 个文件,涉及 tools 等模块。代码变更包括 74 行新增和 60 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (5 files, 134 changes: +74/-60)
tools/ci_build/github/azure-pipelines/plugin-webgpu-test-pipeline.yml
tools/ci_build/github/azure-pipelines/stages/plugin-mac-webgpu-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-win-webgpu-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-win-webgpu-test-stage.yml
tools/ci_build/github/linux/build_webgpu_plugin_package.sh
plugin-ep-webgpu/release:0.1.0
🤖 AI 摘要

本 PR 标题为"[WebGPU] LinearAttention: increase tile_v when subgroups are available",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 12 行新增和 11 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (2 files, 23 changes: +12/-11)
onnxruntime/contrib_ops/webgpu/bert/linear_attention.cc
onnxruntime/contrib_ops/webgpu/bert/linear_attention.wgsl.template
🤖 AI 摘要

本 PR 标题为"Derive ORT_TEST_VERBOSE from System.Debug via runtime coalesce in plugin test pipelines",主要修改了 7 个文件,涉及 tools 等模块。代码变更包括 13 行新增和 5 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (7 files, 18 changes: +13/-5)
tools/ci_build/github/azure-pipelines/plugin-cuda-test-pipeline.yml
tools/ci_build/github/azure-pipelines/plugin-webgpu-test-pipeline.yml
tools/ci_build/github/azure-pipelines/stages/plugin-linux-cuda-test-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-linux-webgpu-test-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-mac-webgpu-test-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-win-cuda-test-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-win-webgpu-test-stage.yml
👤 xiaofeihan1📅 Created: 05/14/2026
🤖 AI 摘要

本 PR 标题为"[webgpu] Add NTC layout support for CausalConvWithState",主要修改了 6 个文件,涉及 onnxruntime 等模块。代码变更包括 102 行新增和 32 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (6 files, 136 changes: +104/-32)
onnxruntime/contrib_ops/cpu/bert/causal_conv_with_state.cc
onnxruntime/contrib_ops/cuda/bert/causal_conv_with_state.cc
onnxruntime/contrib_ops/webgpu/bert/causal_conv_with_state.cc
onnxruntime/contrib_ops/webgpu/bert/causal_conv_with_state.h
onnxruntime/contrib_ops/webgpu/bert/causal_conv_with_state.wgsl.template
onnxruntime/core/graph/contrib_ops/bert_defs.cc
ep:WebGPU
👤 feich-ms📅 Created: 05/14/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Add opset 24 support and Gemma 4 GQA enhancements",主要修改了 7 个文件,涉及 onnxruntime 等模块。代码变更包括 265 行新增和 20 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (7 files, 284 changes: +264/-20)
onnxruntime/contrib_ops/webgpu/bert/attention_common.h
onnxruntime/contrib_ops/webgpu/bert/flash_attention.cc
onnxruntime/contrib_ops/webgpu/bert/group_query_attention.cc
onnxruntime/core/providers/webgpu/tensor/cast.cc
onnxruntime/core/providers/webgpu/tensor/shape_op.cc
onnxruntime/core/providers/webgpu/webgpu_execution_provider.cc
onnxruntime/test/contrib_ops/group_query_attention_op_test.cc
ep:WebGPU
🤖 AI 摘要

本 PR 标题为"Implement staged CI pipeline: Linux CPU → Linux CUDA → everything else",主要修改了 29 个文件,涉及 .github 等模块。代码变更包括 287 行新增和 184 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (29 files, 471 changes: +287/-184)
.github/workflows/android.yml
.github/workflows/ios.yml
.github/workflows/linux-wasm-ci-build-and-test-workflow.yml
.github/workflows/linux_cuda_ci.yml
.github/workflows/linux_cuda_plugin_ci.yml
.github/workflows/linux_minimal_build.yml
.github/workflows/linux_openvino_ci.yml
.github/workflows/linux_tensorrt_ci.yml
.github/workflows/linux_webgpu.yml
.github/workflows/mac.yml
.github/workflows/macos-ci-build-and-test-workflow.yml
.github/workflows/react_native.yml
.github/workflows/reusable_linux_build.yml
.github/workflows/web.yml
.github/workflows/windows_build_x64_asan.yml
.github/workflows/windows_cuda.yml
.github/workflows/windows_cuda_plugin.yml
.github/workflows/windows_dml.yml
.github/workflows/windows_gpu_doc_gen.yml
.github/workflows/windows_openvino.yml
.github/workflows/windows_qnn_x64.yml
.github/workflows/windows_tensorrt.yml
.github/workflows/windows_webgpu.yml
.github/workflows/windows_x64_debug_build_x64_debug.yml
.github/workflows/windows_x64_release_build_x64_release.yml
.github/workflows/windows_x64_release_ep_generic_interface_build_x64_release_ep_generic_interface.yml
.github/workflows/windows_x64_release_vitisai_build_x64_release.yml
.github/workflows/windows_x64_release_xnnpack.yml
.github/workflows/windows_x86.yml
👤 hariharans29📅 Created: 05/12/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Fuse Q/K RMSNorm into GroupQueryAttention for Qwen3-style models",主要修改了 15 个文件,涉及 onnxruntime、js 等模块。代码变更包括 1072 行新增和 43 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (17 files, 1166 changes: +1119/-47)
docs/ContribOperators.md
docs/OperatorKernels.md
js/web/lib/wasm/jsep/webgpu/ops/group-query-attention.ts
onnxruntime/contrib_ops/cpu/bert/group_query_attention.cc
onnxruntime/contrib_ops/cuda/bert/group_query_attention.cc
onnxruntime/contrib_ops/webgpu/bert/group_query_attention.cc
onnxruntime/contrib_ops/webgpu/bert/group_query_attention.h
onnxruntime/contrib_ops/webgpu/bert/rotary_embedding.cc
onnxruntime/contrib_ops/webgpu/bert/rotary_embedding.h
onnxruntime/core/graph/contrib_ops/bert_defs.cc
onnxruntime/core/optimizer/graph_transformer_utils.cc
onnxruntime/core/optimizer/group_query_attention_pre_norm_fusion.cc
onnxruntime/core/optimizer/group_query_attention_pre_norm_fusion.h
onnxruntime/core/providers/webgpu/math/unary_elementwise_ops.h
onnxruntime/core/providers/webgpu/nn/layer_norm.cc
onnxruntime/core/providers/webgpu/nn/layer_norm.h
onnxruntime/test/optimizer/group_query_attention_pre_norm_fusion_test.cc
ep:WebGPU
👤 xhcao📅 Created: 05/09/2026
🤖 AI 摘要

本 PR 标题为"webgpu: support vec2 type for gemm-subgroup",主要修改了 7 个文件,涉及 onnxruntime 等模块。代码变更包括 57 行新增和 48 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (7 files, 105 changes: +57/-48)
onnxruntime/core/providers/webgpu/math/matmul.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm.h
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm_subgroup.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm_subgroup.h
onnxruntime/core/providers/webgpu/vendor/intel/math/matmul.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/matmul.h
ep:WebGPU