ONNX Runtime WebGPU PR Monitor

Last Updated: 07/03/2026, 07:24 PM | Total: 312 PRs

Showing 1-10 of 56 PRs
Page 1 of 6
🤖 AI 摘要

本 PR 标题为"[CUDA] Support attention_bias in GroupQueryAttention via the unfused path",主要修改了 4 个文件,涉及 onnxruntime 等模块。代码变更包括 175 行新增和 20 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (4 files, 195 changes: +175/-20)
onnxruntime/contrib_ops/cuda/bert/attention_data.h
onnxruntime/contrib_ops/cuda/bert/group_query_attention.cc
onnxruntime/contrib_ops/cuda/bert/group_query_attention_impl.cu
onnxruntime/test/python/transformers/test_gqa.py
🤖 AI 摘要

本 PR 标题为"[webgpu] Enable im2col-matmul for newer Xe platforms; limit to fp16",主要修改了 3 个文件,涉及 onnxruntime 等模块。代码变更包括 18 行新增和 5 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (3 files, 23 changes: +18/-5)
onnxruntime/core/providers/webgpu/nn/conv.cc
onnxruntime/core/providers/webgpu/nn/im2col_matmul.cc
onnxruntime/core/providers/webgpu/nn/im2col_matmul.h
👤 hariharans29📅 Created: 07/02/2026
🤖 AI 摘要

本 PR 标题为"[Packaging] Packaging onnxruntime-node for macOS x86-64",主要修改了 9 个文件,涉及 tools、.github 等模块。代码变更包括 100 行新增和 24 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (9 files, 124 changes: +100/-24)
.github/workflows/mac.yml
.github/workflows/macos-ci-build-and-test-workflow.yml
tools/ci_build/github/azure-pipelines/stages/nodejs-npm-packaging-stage.yml
tools/ci_build/github/azure-pipelines/templates/c-api-cpu.yml
tools/ci_build/github/azure-pipelines/templates/mac-cpu-packaging-pipeline.yml
tools/ci_build/github/azure-pipelines/templates/mac-cpu-packaging-steps.yml
tools/ci_build/github/azure-pipelines/templates/mac-cpu-packing-jobs.yml
tools/ci_build/github/windows/jar_packaging.py
tools/ci_build/github/windows/jar_packaging_test.py
🤖 AI 摘要

本 PR 标题为"[web] Support Blob-backed external data for on-demand loading in JSPI builds",主要修改了 7 个文件,涉及 cmake、js、onnxruntime 等模块。代码变更包括 186 行新增和 5 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (7 files, 191 changes: +186/-5)
cmake/adjust_global_compile_flags.cmake
js/web/lib/wasm/wasm-core-impl.ts
js/web/lib/wasm/wasm-types.ts
js/web/test/e2e/browser-test-webgpu-external-data-blob.js
js/web/test/e2e/run-data.js
onnxruntime/core/framework/external_data_loader.cc
onnxruntime/wasm/pre.js
🤖 AI 摘要

本 PR 标题为"Validate per-element split sizes on the input-tensor path to prevent OOB read",主要修改了 3 个文件,涉及 onnxruntime 等模块。代码变更包括 43 行新增和 0 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (3 files, 43 changes: +43/-0)
onnxruntime/core/providers/cpu/tensor/split.h
onnxruntime/core/providers/cuda/tensor/split.cc
onnxruntime/test/providers/cpu/tensor/split_op_test.cc
🤖 AI 摘要

本 PR 标题为"Fix a regression in graph-capture session initialization that rejects an empty graph",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 53 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (2 files, 60 changes: +53/-7)
onnxruntime/core/session/inference_session.cc
onnxruntime/test/shared_lib/test_inference.cc
👤 nicholascelestin📅 Created: 07/01/2026
🤖 AI 摘要

本 PR 标题为"[js/webgpu] Add DFT operator",主要修改了 8 个文件,涉及 js、onnxruntime 等模块。代码变更包括 621 行新增和 0 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (8 files, 621 changes: +621/-0)
js/web/docs/webgpu-operators.md
js/web/lib/wasm/jsep/webgpu/op-resolve-rules.ts
js/web/lib/wasm/jsep/webgpu/ops/dft.ts
js/web/test/data/ops/dft.jsonc
js/web/test/suite-test-list.jsonc
onnxruntime/core/providers/js/js_execution_provider.cc
onnxruntime/core/providers/js/operators/dft.cc
onnxruntime/core/providers/js/operators/dft.h
🤖 AI 摘要

本 PR 标题为"WebGPU: enable INT64 for Equal/Sub/Where/ReduceSum under enable_int64 flag",主要修改了 7 个文件,涉及 onnxruntime 等模块。代码变更包括 218 行新增和 42 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (10 files, 578 changes: +495/-83)
onnxruntime/core/providers/webgpu/math/binary_elementwise_ops.cc
onnxruntime/core/providers/webgpu/math/binary_elementwise_ops.h
onnxruntime/core/providers/webgpu/reduction/reduction_ops.cc
onnxruntime/core/providers/webgpu/reduction/reduction_ops.h
onnxruntime/core/providers/webgpu/tensor/where.cc
onnxruntime/core/providers/webgpu/tensor/where.h
onnxruntime/core/providers/webgpu/webgpu_execution_provider.cc
onnxruntime/test/providers/cpu/math/element_wise_ops_test.cc
onnxruntime/test/providers/cpu/reduction/reduction_ops_test.cc
onnxruntime/test/providers/cpu/tensor/where_op_test.cc
ep:WebGPU
👤 Jiawei-Shao📅 Created: 06/29/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Upgrade Dawn to the latest",主要修改了 5 个文件,涉及 cmake、onnxruntime 等模块。代码变更包括 12 行新增和 58 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (5 files, 70 changes: +12/-58)
cmake/deps.txt
cmake/external/onnxruntime_external_deps.cmake
cmake/patches/dawn/dawn_buffer_fix_injection.patch
cmake/patches/dawn/dawn_destroy_buffer_on_destructor.patch
onnxruntime/core/providers/webgpu/webgpu_context.cc
👤 xhcao📅 Created: 06/26/2026
🤖 AI 摘要

本 PR 标题为"webgpu: two optimizations for the subgroup Gemm/MatMul kernels:",主要修改了 8 个文件,涉及 onnxruntime 等模块。代码变更包括 252 行新增和 99 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (7 files, 193 changes: +157/-36)
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm.h
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm_subgroup.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/gemm_subgroup.h
onnxruntime/core/providers/webgpu/vendor/intel/math/matmul.cc
onnxruntime/core/providers/webgpu/vendor/intel/math/matmul.h
onnxruntime/test/providers/webgpu/matmul_large_test.cc