ONNX Runtime WebGPU PR Monitor

Last Updated: 06/12/2026, 08:13 PM | Total: 286 PRs

Showing 1-10 of 59 PRs
Page 1 of 6
👤 adrastogi📅 Created: 06/12/2026
🤖 AI 摘要

本 PR 标题为"Plugin WebGPU EP Branch: Update protobufjs versions",主要修改了 2 个文件,涉及 js 等模块。代码变更包括 120 行新增和 106 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (2 files, 226 changes: +120/-106)
js/node/package-lock.json
js/web/package-lock.json
👤 tairenpiao📅 Created: 06/12/2026
🤖 AI 摘要

本 PR 标题为"Fix WebGPU GatherBlockQuantized dispatch failure for empty indices",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 25 行新增和 0 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (2 files, 25 changes: +25/-0)
onnxruntime/contrib_ops/webgpu/quantization/gather_block_quantized.cc
onnxruntime/test/contrib_ops/gather_block_quantized_op_test.cc
👤 daijh📅 Created: 06/12/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Fix profiling timestamp alignment with ORT profiler",主要修改了 5 个文件,涉及 onnxruntime 等模块。代码变更包括 24 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (5 files, 31 changes: +24/-7)
onnxruntime/core/providers/webgpu/webgpu_context.cc
onnxruntime/core/providers/webgpu/webgpu_context.h
onnxruntime/core/providers/webgpu/webgpu_execution_provider.cc
onnxruntime/core/providers/webgpu/webgpu_profiler.cc
onnxruntime/core/providers/webgpu/webgpu_profiler.h
👤 ssam18📅 Created: 06/11/2026
🤖 AI 摘要

本 PR 标题为"[js/web] Forward WebGPU EP buffer cache mode options from JS",主要修改了 6 个文件,涉及 onnxruntime、js 等模块。代码变更包括 67 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (6 files, 74 changes: +67/-7)
js/common/lib/inference-session.ts
js/web/lib/wasm/session-options.ts
onnxruntime/core/providers/webgpu/buffer_manager.cc
onnxruntime/core/providers/webgpu/buffer_manager.h
onnxruntime/core/providers/webgpu/webgpu_context.cc
onnxruntime/core/providers/webgpu/webgpu_execution_provider.cc
👤 qjia7📅 Created: 06/11/2026
🤖 AI 摘要

本 PR 标题为"webgpu: fix GQA batched right-padded prefill with do_rotary",主要修改了 6 个文件,涉及 onnxruntime 等模块。代码变更包括 205 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (6 files, 212 changes: +205/-7)
onnxruntime/contrib_ops/webgpu/bert/flash_attention.cc
onnxruntime/contrib_ops/webgpu/bert/flash_attention.h
onnxruntime/contrib_ops/webgpu/bert/group_query_attention.cc
onnxruntime/contrib_ops/webgpu/bert/rotary_embedding.cc
onnxruntime/contrib_ops/webgpu/bert/split_packed_qkv_with_rotary_embedding.wgsl.template
onnxruntime/test/contrib_ops/group_query_attention_op_test.cc
👤 feich-ms📅 Created: 06/11/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Graph capture support for KV-shared decoder models",主要修改了 5 个文件,涉及 onnxruntime 等模块。代码变更包括 204 行新增和 5 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (5 files, 209 changes: +204/-5)
onnxruntime/contrib_ops/webgpu/bert/flash_attention.cc
onnxruntime/contrib_ops/webgpu/bert/flash_attention.h
onnxruntime/core/providers/webgpu/generator/constant_of_shape.cc
onnxruntime/core/providers/webgpu/generator/constant_of_shape.h
onnxruntime/core/providers/webgpu/webgpu_execution_provider.cc
ep:WebGPU
🤖 AI 摘要

本 PR 标题为"Fix WebGPU ConvTranspose incorrect output for fp16 models (output spatial dim > 2048)",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 4 行新增和 4 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (1 files, 8 changes: +4/-4)
onnxruntime/core/providers/webgpu/nn/conv_backprop.cc
👤 GopalakrishnanN📅 Created: 06/09/2026
🤖 AI 摘要

本 PR 标题为"Add Execution Provider conformance test suite",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 261 行新增和 0 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (1 files, 261 changes: +261/-0)
onnxruntime/test/framework/execution_provider_conformance_test.cc
👤 tianleiwu📅 Created: 06/09/2026
🤖 AI 摘要

本 PR 标题为"Add flash attention for non-quantized CPU GroupQueryAttention",主要修改了 6 个文件,涉及 onnxruntime、docs、cmake 等模块。代码变更包括 1052 行新增和 5 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (6 files, 1057 changes: +1052/-5)
cmake/onnxruntime_mlas.cmake
docs/contrib_ops/cpu/gqa.md
onnxruntime/contrib_ops/cpu/bert/gqa_attention_base.h
onnxruntime/contrib_ops/cpu/bert/group_query_attention.cc
onnxruntime/core/mlas/inc/mlas.h
onnxruntime/core/mlas/lib/flashattn_gqa.cpp
👤 feich-ms📅 Created: 06/09/2026
🤖 AI 摘要

本 PR 标题为"[WebGPU] Enable graph capture for Gemma4-class decoder models",主要修改了 13 个文件,涉及 onnxruntime 等模块。代码变更包括 930 行新增和 41 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。

📁 Changed Files (12 files, 690 changes: +659/-31)
onnxruntime/contrib_ops/webgpu/bert/flash_attention.cc
onnxruntime/contrib_ops/webgpu/bert/flash_attention.h
onnxruntime/core/optimizer/gqa_mask_reformatting_to_graph_capture.cc
onnxruntime/core/optimizer/gqa_mask_reformatting_to_graph_capture.h
onnxruntime/core/optimizer/graph_transformer_utils.cc
onnxruntime/core/providers/webgpu/generator/constant_of_shape.cc
onnxruntime/core/providers/webgpu/generator/constant_of_shape.h
onnxruntime/core/providers/webgpu/math/binary_elementwise_ops.cc
onnxruntime/core/providers/webgpu/math/binary_elementwise_ops.h
onnxruntime/core/providers/webgpu/tensor/where.cc
onnxruntime/core/providers/webgpu/tensor/where.h
onnxruntime/core/providers/webgpu/webgpu_execution_provider.cc