本 PR 标题为"TurboQuant KV cache (4/4): Python reference impl + last_token_logits patcher",主要修改了 20 个文件,涉及 onnxruntime、include 等模块。代码变更包括 3033 行新增和 10 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"TurboQuant KV cache (3/4): WebGPU kernels + Safari/Firefox fallback",主要修改了 16 个文件,涉及 onnxruntime、include 等模块。代码变更包括 2014 行新增和 27 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"TurboQuant KV cache (2/4): CUDA kernels",主要修改了 16 个文件,涉及 onnxruntime、include 等模块。代码变更包括 3353 行新增和 28 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"TurboQuant KV cache (1/4): graph rewrite + schema (foundation)",主要修改了 10 个文件,涉及 onnxruntime、include 等模块。代码变更包括 972 行新增和 10 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[docs] Add WebGPU EP docs",主要修改了 3 个文件,涉及 docs 等模块。代码变更包括 250 行新增和 2 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Reserve WebGPU program vector capacity",主要修改了 5 个文件,涉及 onnxruntime 等模块。代码变更包括 48 行新增和 1 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Update GatherBlockQuantized to support 2-bits",主要修改了 6 个文件,涉及 onnxruntime、docs 等模块。代码变更包括 253 行新增和 22 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU plugin EP] Add Win ARM64 Python package",主要修改了 5 个文件,涉及 tools 等模块。代码变更包括 74 行新增和 60 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"Check weight shape dimensions in ConvTranspose shape inference msrc116345",主要修改了 9 个文件,涉及 onnxruntime 等模块。代码变更包括 445 行新增和 40 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。
本 PR 标题为"[WebGPU] LinearAttention: increase tile_v when subgroups are available",主要修改了 2 个文件,涉及 onnxruntime 等模块。代码变更包括 12 行新增和 11 行删除。 这是一个与 ONNX Runtime WebGPU 相关的改动,具体功能需要查看代码详情。