本 PR 标题为"webgpu: Enable FlashAttention for batched GQA with right-padded prompts",主要修改了 5 个文件,涉及 onnxruntime 等模块。代码变更包括 130 行新增和 74 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Clamp derived sequence lengths and KV-cache index in CUDA GroupQueryAttention",主要修改了 3 个文件,涉及 onnxruntime 等模块。代码变更包括 113 行新增和 3 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"WebGPU: Add indirect dispatch for flash attention graph capture",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 50 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"WebGPU: make WebGpuContextFactory::Cleanup exception-safe and idempotent",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 23 行新增和 6 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Recover Conv/ConvTranspose rank from weight when input shape is unknown",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 11 行新增和 4 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Add 2-bit quantization support to WebGPU GatherBlockQuantized operator",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 13 行新增和 4 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU plugin EP] Update release and packaging-related docs",主要修改了 8 个文件,涉及 tools、plugin-ep-webgpu 等模块。代码变更包括 143 行新增和 57 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Plugin WebGPU EP Branch: Update protobufjs versions",主要修改了 2 个文件,涉及 js 等模块。代码变更包括 120 行新增和 106 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Fix WebGPU ConvTranspose incorrect output for fp16 models (output spatial dim > 2048)",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 4 行新增和 4 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Add Execution Provider conformance test suite",主要修改了 1 个文件,涉及 onnxruntime 等模块。代码变更包括 261 行新增和 0 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。