本 PR 标题为"[WebGPU plugin EP] Add Win ARM64 Python package",主要修改了 5 个文件,涉及 tools 等模块。代码变更包括 74 行新增和 60 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU plugin EP] Package improvements",主要修改了 13 个文件,涉及 plugin-ep-webgpu 等模块。代码变更包括 88 行新增和 32 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"webgpu: Generalize FlashAttention prefill shared-memory path",主要修改了 3 个文件,涉及 onnxruntime 等模块。代码变更包括 13 行新增和 11 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU] LinearAttention: increase tile_v when subgroups are available",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 12 行新增和 11 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Derive ORT_TEST_VERBOSE from System.Debug via runtime coalesce in plugin test pipelines",主要修改了 7 个文件,涉及 tools 等模块。代码变更包括 13 行新增和 5 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[webgpu] Add NTC layout support for CausalConvWithState",主要修改了 6 个文件,涉及 onnxruntime 等模块。代码变更包括 102 行新增和 32 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU] Add opset 24 support and Gemma 4 GQA enhancements",主要修改了 7 个文件,涉及 onnxruntime 等模块。代码变更包括 265 行新增和 20 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Implement staged CI pipeline: Linux CPU → Linux CUDA → everything else",主要修改了 29 个文件,涉及 .github 等模块。代码变更包括 287 行新增和 184 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU] Fuse Q/K RMSNorm into GroupQueryAttention for Qwen3-style models",主要修改了 15 个文件,涉及 onnxruntime、js 等模块。代码变更包括 1072 行新增和 43 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"webgpu: support vec2 type for gemm-subgroup",主要修改了 7 个文件,涉及 onnxruntime 等模块。代码变更包括 57 行新增和 48 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。