ONNX Runtime WebGPU PR Monitor

Last Updated: 06/10/2026, 08:34 PM | Total: 280 PRs

Showing 1-10 of 56 PRs
Page 1 of 6
👤 tianleiwu📅 Created: 06/10/2026
🤖 AI 摘要

本 PR 标题为"Remove hard core ORT dependency from CUDA plugin EP packages",主要修改了 11 个文件,涉及 tools、plugin-ep-cuda 等模块。代码变更包括 138 行新增和 64 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (11 files, 202 changes: +138/-64)
plugin-ep-cuda/README.md
plugin-ep-cuda/_packaging_utils.py
plugin-ep-cuda/csharp/Microsoft.ML.OnnxRuntime.EP.Cuda/Microsoft.ML.OnnxRuntime.EP.Cuda.csproj
plugin-ep-cuda/csharp/Microsoft.ML.OnnxRuntime.EP.Cuda/README.md
plugin-ep-cuda/csharp/pack_nuget.py
plugin-ep-cuda/csharp/test/CudaEpNuGetTest/CudaEpNuGetTest.csproj
plugin-ep-cuda/python/build_wheel.py
plugin-ep-cuda/python/onnxruntime_ep_cuda/README.md
plugin-ep-cuda/python/pyproject.toml.in
tools/ci_build/github/azure-pipelines/stages/plugin-linux-cuda-test-stage.yml
tools/ci_build/github/azure-pipelines/stages/plugin-win-cuda-test-stage.yml
🤖 AI 摘要

本 PR 标题为"Fix WebGPU ConvTranspose incorrect output for fp16 models (output spatial dim > 2048)",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 4 行新增和 4 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (1 files, 8 changes: +4/-4)
onnxruntime/core/providers/webgpu/nn/conv_backprop.cc
👤 GopalakrishnanN📅 Created: 06/09/2026
🤖 AI 摘要

本 PR 标题为"Add Execution Provider conformance test suite",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 261 行新增和 0 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (1 files, 261 changes: +261/-0)
onnxruntime/test/framework/execution_provider_conformance_test.cc
👤 tianleiwu📅 Created: 06/09/2026
🤖 AI 摘要

本 PR 标题为"Add flash attention for non-quantized CPU GroupQueryAttention",主要修改了 6 个文件,涉及 onnxruntime、docs、cmake 等模块。代码变更包括 1052 行新增和 5 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (6 files, 1057 changes: +1052/-5)
cmake/onnxruntime_mlas.cmake
docs/contrib_ops/cpu/gqa.md
onnxruntime/contrib_ops/cpu/bert/gqa_attention_base.h
onnxruntime/contrib_ops/cpu/bert/group_query_attention.cc
onnxruntime/core/mlas/inc/mlas.h
onnxruntime/core/mlas/lib/flashattn_gqa.cpp
👤 feich-ms📅 Created: 06/09/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Enable graph capture for Gemma4-class decoder models",主要修改了 13 个文件,涉及 onnxruntime 等模块。代码变更包括 930 行新增和 41 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (13 files, 971 changes: +930/-41)
onnxruntime/contrib_ops/webgpu/bert/flash_attention.cc
onnxruntime/contrib_ops/webgpu/bert/flash_attention.h
onnxruntime/core/optimizer/gqa_mask_reformatting_to_graph_capture.cc
onnxruntime/core/optimizer/gqa_mask_reformatting_to_graph_capture.h
onnxruntime/core/optimizer/graph_transformer_utils.cc
onnxruntime/core/providers/webgpu/buffer_manager.cc
onnxruntime/core/providers/webgpu/generator/constant_of_shape.cc
onnxruntime/core/providers/webgpu/generator/constant_of_shape.h
onnxruntime/core/providers/webgpu/math/binary_elementwise_ops.cc
onnxruntime/core/providers/webgpu/math/binary_elementwise_ops.h
onnxruntime/core/providers/webgpu/tensor/where.cc
onnxruntime/core/providers/webgpu/tensor/where.h
onnxruntime/core/providers/webgpu/webgpu_execution_provider.cc
👤 Jayashree-mcw📅 Created: 06/08/2026
🤖 AI 摘要

本 PR 标题为"Fix: Add CMake package files to Windows artifact #28468",主要修改了 1 个文件,涉及 tools 等模块。代码变更包括 111 行新增和 50 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (1 files, 200 changes: +150/-50)
tools/ci_build/github/azure-pipelines/templates/c-api-artifacts-package-and-publish-steps-windows.yml
👤 Reranko05📅 Created: 06/07/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Make max_num_pending_dispatches configurable",主要修改了 5 个文件,涉及 onnxruntime 等模块。代码变更包括 62 行新增和 1 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (5 files, 67 changes: +66/-1)
onnxruntime/core/providers/webgpu/webgpu_context.cc
onnxruntime/core/providers/webgpu/webgpu_context.h
onnxruntime/core/providers/webgpu/webgpu_provider_factory.cc
onnxruntime/core/providers/webgpu/webgpu_provider_options.h
onnxruntime/test/providers/cpu/tensor/expand_test.cc
🤖 AI 摘要

本 PR 标题为"Lower CUDA plugin EP minimum ORT version to 1.24.4 with version-gated callbacks",主要修改了 16 个文件,涉及 onnxruntime、cmake、docs 等模块。代码变更包括 230 行新增和 59 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (17 files, 360 changes: +280/-80)
cmake/onnxruntime_providers_cuda_plugin.cmake
docs/cuda_plugin_ep/QUICK_START.md
docs/cuda_plugin_ep/cuda_plugin_ep_design.md
include/onnxruntime/core/session/onnxruntime_ep_c_api.h
onnxruntime/core/providers/cuda/plugin/cuda_allocator_plugin.cc
onnxruntime/core/providers/cuda/plugin/cuda_arena.h
onnxruntime/core/providers/cuda/plugin/cuda_controlflow_plugin.cc
onnxruntime/core/providers/cuda/plugin/cuda_data_transfer_plugin.cc
onnxruntime/core/providers/cuda/plugin/cuda_ep.cc
onnxruntime/core/providers/cuda/plugin/cuda_ep_factory.cc
onnxruntime/core/providers/cuda/plugin/cuda_mempool_allocator_plugin.cc
onnxruntime/core/providers/cuda/plugin/cuda_plugin_ep.cc
onnxruntime/core/providers/cuda/plugin/cuda_plugin_utils.h
onnxruntime/core/providers/cuda/plugin/cuda_profiler_plugin.cc
onnxruntime/core/providers/cuda/plugin/cuda_stream_plugin.cc
plugin-ep-cuda/MIN_ONNXRUNTIME_VERSION
tools/ci_build/github/azure-pipelines/stages/plugin-linux-cuda-test-stage.yml
👤 Copilot📅 Created: 06/05/2026
🤖 AI 摘要

本 PR 标题为"Fix stale output shape metadata in WebGPU external-data E2E model",主要修改了 3 个文件,涉及 js、onnxruntime 等模块。代码变更包括 7 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (3 files, 14 changes: +7/-7)
js/web/test/e2e/model_with_orig_ext_data.onnx
onnxruntime/test/testdata/model_with_external_initializers.py
onnxruntime/test/testdata/model_with_orig_ext_data.onnx
👤 fanchenkong1📅 Created: 06/05/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Enable Cast to int64 by default",主要修改了 3 个文件,涉及 onnxruntime 等模块。代码变更包括 360 行新增和 18 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (5 files, 431 changes: +402/-29)
onnxruntime/core/providers/webgpu/shader_variable.cc
onnxruntime/core/providers/webgpu/shader_variable.h
onnxruntime/core/providers/webgpu/tensor/cast.cc
onnxruntime/core/providers/webgpu/tensor/cast.h
onnxruntime/test/providers/cpu/tensor/cast_op_test.cc
ep:WebGPU