ONNX Runtime WebGPU PR Monitor

Last Updated: 06/06/2026, 07:23 PM | Total: 273 PRs

Showing 1-10 of 53 PRs
Page 1 of 6
🤖 AI 摘要

本 PR 标题为"Lower CUDA plugin EP minimum ORT version to 1.24.4 with version-gated callbacks",主要修改了 16 个文件,涉及 onnxruntime、cmake、docs 等模块。代码变更包括 230 行新增和 59 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (16 files, 289 changes: +230/-59)
cmake/onnxruntime_providers_cuda_plugin.cmake
docs/cuda_plugin_ep/QUICK_START.md
docs/cuda_plugin_ep/cuda_plugin_ep_design.md
onnxruntime/core/providers/cuda/plugin/cuda_allocator_plugin.cc
onnxruntime/core/providers/cuda/plugin/cuda_arena.h
onnxruntime/core/providers/cuda/plugin/cuda_controlflow_plugin.cc
onnxruntime/core/providers/cuda/plugin/cuda_data_transfer_plugin.cc
onnxruntime/core/providers/cuda/plugin/cuda_ep.cc
onnxruntime/core/providers/cuda/plugin/cuda_ep_factory.cc
onnxruntime/core/providers/cuda/plugin/cuda_mempool_allocator_plugin.cc
onnxruntime/core/providers/cuda/plugin/cuda_plugin_ep.cc
onnxruntime/core/providers/cuda/plugin/cuda_plugin_utils.h
onnxruntime/core/providers/cuda/plugin/cuda_profiler_plugin.cc
onnxruntime/core/providers/cuda/plugin/cuda_stream_plugin.cc
plugin-ep-cuda/MIN_ONNXRUNTIME_VERSION
tools/ci_build/github/azure-pipelines/stages/plugin-linux-cuda-test-stage.yml
👤 Copilot📅 Created: 06/05/2026
🤖 AI 摘要

本 PR 标题为"Fix stale output shape metadata in WebGPU external-data E2E model",主要修改了 3 个文件,涉及 js、onnxruntime 等模块。代码变更包括 7 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (3 files, 14 changes: +7/-7)
js/web/test/e2e/model_with_orig_ext_data.onnx
onnxruntime/test/testdata/model_with_external_initializers.py
onnxruntime/test/testdata/model_with_orig_ext_data.onnx
👤 fanchenkong1📅 Created: 06/05/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Enable Cast to int64 by default",主要修改了 3 个文件,涉及 onnxruntime 等模块。代码变更包括 360 行新增和 18 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (3 files, 378 changes: +360/-18)
onnxruntime/core/providers/webgpu/tensor/cast.cc
onnxruntime/core/providers/webgpu/tensor/cast.h
onnxruntime/test/providers/cpu/tensor/cast_op_test.cc
👤 qjia7📅 Created: 06/05/2026
🤖 AI 摘要

本 PR 标题为"webgpu: Normalize indirect-dispatch buffer in flash attention",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 46 行新增和 11 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (2 files, 57 changes: +46/-11)
onnxruntime/contrib_ops/webgpu/bert/flash_attention.cc
onnxruntime/contrib_ops/webgpu/bert/split_packed_qkv_with_rotary_embedding_and_copykv.wgsl.template
👤 qjia7📅 Created: 06/05/2026
🤖 AI 摘要

本 PR 标题为"webgpu: Normalize indirect-dispatch buffer in flash attention",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 46 行新增和 11 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (2 files, 57 changes: +46/-11)
onnxruntime/contrib_ops/webgpu/bert/flash_attention.cc
onnxruntime/contrib_ops/webgpu/bert/split_packed_qkv_with_rotary_embedding_and_copykv.wgsl.template
👤 jambayk📅 Created: 06/04/2026
🤖 AI 摘要

本 PR 标题为"Add session.qdq_strip_activations option for QDQ models",主要修改了 7 个文件,涉及 onnxruntime、include 等模块。代码变更包括 926 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (7 files, 933 changes: +926/-7)
include/onnxruntime/core/session/onnxruntime_session_options_config_keys.h
onnxruntime/core/optimizer/graph_transformer_utils.cc
onnxruntime/core/optimizer/qdq_transformer/qdq_strip_activations_transformer.cc
onnxruntime/core/optimizer/qdq_transformer/qdq_strip_activations_transformer.h
onnxruntime/core/optimizer/qdq_transformer/selectors_actions/qdq_selector_action_transformer.cc
onnxruntime/core/optimizer/qdq_transformer/selectors_actions/qdq_selector_action_transformer.h
onnxruntime/test/optimizer/qdq_strip_activations_transformer_test.cc
👤 Copilot📅 Created: 06/04/2026
🤖 AI 摘要

本 PR 标题为"docs: Update outdated documentation pages",主要修改了 8 个文件,涉及 docs 等模块。代码变更包括 82 行新增和 35 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (8 files, 116 changes: +81/-35)
docs/get-started/community-projects.md
docs/get-started/training-pytorch.md
docs/get-started/with-python.md
docs/get-started/with-windows.md
docs/install/index.md
docs/performance/model-optimizations/ort-format-models.md
docs/reference/operators/index.md
docs/tutorials/accelerate-pytorch/pytorch.md
👤 qjia7📅 Created: 06/03/2026
🤖 AI 摘要

本 PR 标题为"webgpu: Add session-level buffer pool for graph capture reuse",主要修改了 8 个文件,涉及 onnxruntime 等模块。代码变更包括 248 行新增和 2 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (8 files, 250 changes: +248/-2)
onnxruntime/core/providers/webgpu/buffer_manager.cc
onnxruntime/core/providers/webgpu/buffer_manager.h
onnxruntime/core/providers/webgpu/session_buffer_pool.cc
onnxruntime/core/providers/webgpu/session_buffer_pool.h
onnxruntime/core/providers/webgpu/webgpu_execution_provider.cc
onnxruntime/core/providers/webgpu/webgpu_execution_provider.h
onnxruntime/core/providers/webgpu/webgpu_provider_factory.cc
onnxruntime/core/providers/webgpu/webgpu_provider_options.h
ep:WebGPU
👤 xhcao📅 Created: 06/03/2026
🤖 AI 摘要

本 PR 标题为"webgpu: adjust the parms for gemm-subgroup kernel",主要修改了 5 个文件,涉及 onnxruntime 等模块。代码变更包括 16 行新增和 8 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (7 files, 281 changes: +271/-10)
onnxruntime/core/providers/webgpu/math/matmul.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm_subgroup.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm_subgroup.h
onnxruntime/core/providers/webgpu/vendor/intel/math/matmul.cc
onnxruntime/test/providers/webgpu/gemm_large_test.cc
onnxruntime/test/providers/webgpu/matmul_large_test.cc
👤 haoxli📅 Created: 06/03/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Fix nearest half-tie handling for round_prefer_ceil/floor",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 84 行新增和 2 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (3 files, 90 changes: +87/-3)
onnxruntime/core/providers/cpu/tensor/upsamplebase.h
onnxruntime/core/providers/webgpu/tensor/resize_impl.cc
onnxruntime/test/providers/cpu/tensor/resize_op_test.cc