本 PR 标题为"Add flash attention for non-quantized CPU GroupQueryAttention",主要修改了 6 个文件,涉及 onnxruntime、docs、cmake 等模块。代码变更包括 1052 行新增和 5 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU] Enable graph capture for Gemma4-class decoder models",主要修改了 13 个文件,涉及 onnxruntime 等模块。代码变更包括 930 行新增和 41 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Fix: Add CMake package files to Windows artifact #28468",主要修改了 1 个文件,涉及 tools 等模块。代码变更包括 111 行新增和 50 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU] Make max_num_pending_dispatches configurable",主要修改了 5 个文件,涉及 onnxruntime 等模块。代码变更包括 62 行新增和 1 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Lower CUDA plugin EP minimum ORT version to 1.24.4 with version-gated callbacks",主要修改了 16 个文件,涉及 onnxruntime、cmake、docs 等模块。代码变更包括 230 行新增和 59 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Fix stale output shape metadata in WebGPU external-data E2E model",主要修改了 3 个文件,涉及 js、onnxruntime 等模块。代码变更包括 7 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU] Enable Cast to int64 by default",主要修改了 3 个文件,涉及 onnxruntime 等模块。代码变更包括 360 行新增和 18 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"webgpu: Normalize indirect-dispatch buffer in flash attention",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 46 行新增和 11 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Add session.qdq_strip_activations option for QDQ models",主要修改了 7 个文件,涉及 onnxruntime、include 等模块。代码变更包括 926 行新增和 7 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"docs: Update outdated documentation pages",主要修改了 8 个文件,涉及 docs 等模块。代码变更包括 82 行新增和 35 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。