graph: backend: dnnl, tests: benchdnn: support sdpa / gqa training with gradients for mask #4404

ElaineBao · 2025-12-02T06:33:41Z

Description

MFDNN-14010.

Use an End op to represent an intermediate output (which has consumers within the partition as well as outside the partition)
Add patterns and related implementation for sdpa/gqa training backward w.r.t gradients for mask
Add test cases, modify benchdnn to support such cases' validation.

w.r.t gradients for mask

for sdpa/gqa training backward w.r.t gradients for mask

TaoLv · 2025-12-02T07:38:39Z

src/graph/interface/op_def.hpp

                                data_type::s8, data_type::u8, data_type::s32,
-                                data_type::undef}))
+                                data_type::undef})
+                .set_shape_inference_function(infer_dummy_output_shape))


Why do we need this? By definition, there is no output for an End op.

The graph's infer shape function will iterate every op in the graph, we can certainly check if one op has output or not to avoid adding a dummy infer shape function for End op here, but I think it's not a better choice because in that way, every op will have to check that condition.

ElaineBao · 2025-12-03T07:55:46Z

make test
set test_scope=NIGHTLY
disable benchdnn_all
enable benchdnn_graph

TaoLv

Any changes required for document? What's the main difference in the fusion graph?

TaoLv · 2025-12-05T03:20:17Z

src/graph/backend/dnnl/dnnl_partition_impl.cpp

+            auto end_input = cur_op->get_input_value(0);
+            outputs_.push_back(end_input->get_logical_tensor());


Suggested change

auto end_input = cur_op->get_input_value(0);

outputs_.push_back(end_input->get_logical_tensor());

outputs_.push_back(end_input->get_input_logical_tensor(0));

TaoLv · 2025-12-05T03:21:00Z

src/graph/backend/dnnl/layout_propagator.cpp

+        const dnnl::engine &p_engine, pd_cache_t &pd_cache,
+        const fpmath_t &fpmath, bool use_block_layout,
+        subgraph_rewriter_t &rewriter) {
+    logical_tensor_t dst_lt = op->get_input_value(0)->get_logical_tensor();


Suggested change

logical_tensor_t dst_lt = op->get_input_value(0)->get_logical_tensor();

logical_tensor_t dst_lt = op->get_input_logical_tensor(0);

TaoLv · 2025-12-05T03:21:44Z

src/graph/backend/dnnl/layout_propagator.cpp

+    auto src_md = make_dnnl_memory_desc(
+            op->get_input_value(0)->get_logical_tensor());


Suggested change

auto src_md = make_dnnl_memory_desc(

op->get_input_value(0)->get_logical_tensor());

auto src_md = make_dnnl_memory_desc(op->get_input_logical_tensor(0));

dzarukin · 2025-12-05T21:52:50Z

src/graph/backend/dnnl/patterns/sdp.cpp

                    pgraph->create_input_port(2, matmul_dv, 1);
                    pgraph->create_input_port(2, matmul_v_do, 0);
                })
+        .set_attr<FCreatePattern>("FCreatePattern",


Just curious why a new pattern and not incorporating into existing one?

dzarukin · 2025-12-05T21:55:37Z

tests/benchdnn/graph/deserialize.cpp

+        if (cur_op_refs.size() == 2 && cur_op_refs[0].kind_ == "End") {
+            matmul_idx = 1;
+        }


Would it be better if:

while (cur_op_refs[matmul_idx].kind_ != "MatMul") { matmul_idx++; }

ElaineBao added 5 commits December 1, 2025 22:18

graph: backend: dnnl: add patterns for sdpa/gqa training backward

5b855f6

w.r.t gradients for mask

graph: interface: enhance support for End op

0453ceb

graph: backend: dnnl: enhance support for End op

0a42468

tests: benchdnn: graph: support validation for sdpa/gqa backward

9c7961e

w.r.t gradients for mask

tests: benchdnn: graph: add test cases

597aa04

for sdpa/gqa training backward w.r.t gradients for mask

ElaineBao self-assigned this Dec 2, 2025

ElaineBao requested a review from a team as a code owner December 2, 2025 06:33

ElaineBao added the component:graph-api Codeowner: @oneapi-src/onednn-graph label Dec 2, 2025

ElaineBao requested a review from a team as a code owner December 2, 2025 06:33

github-actions bot added the component:tests Codeowner: @oneapi-src/onednn-arch label Dec 2, 2025

TaoLv reviewed Dec 2, 2025

View reviewed changes

TaoLv reviewed Dec 5, 2025

View reviewed changes

dzarukin approved these changes Dec 5, 2025

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

graph: backend: dnnl, tests: benchdnn: support sdpa / gqa training with gradients for mask #4404

graph: backend: dnnl, tests: benchdnn: support sdpa / gqa training with gradients for mask #4404

Uh oh!

ElaineBao commented Dec 2, 2025

Uh oh!

TaoLv Dec 2, 2025

Uh oh!

ElaineBao Dec 2, 2025

Uh oh!

ElaineBao commented Dec 3, 2025

Uh oh!

TaoLv left a comment

Uh oh!

TaoLv Dec 5, 2025

Uh oh!

TaoLv Dec 5, 2025

Uh oh!

TaoLv Dec 5, 2025

Uh oh!

dzarukin Dec 5, 2025

Uh oh!

dzarukin Dec 5, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

		auto end_input = cur_op->get_input_value(0);
		outputs_.push_back(end_input->get_logical_tensor());

	auto end_input = cur_op->get_input_value(0);
	outputs_.push_back(end_input->get_logical_tensor());
	outputs_.push_back(end_input->get_input_logical_tensor(0));

	logical_tensor_t dst_lt = op->get_input_value(0)->get_logical_tensor();
	logical_tensor_t dst_lt = op->get_input_logical_tensor(0);

		auto src_md = make_dnnl_memory_desc(
		op->get_input_value(0)->get_logical_tensor());

	auto src_md = make_dnnl_memory_desc(
	op->get_input_value(0)->get_logical_tensor());
	auto src_md = make_dnnl_memory_desc(op->get_input_logical_tensor(0));

graph: backend: dnnl, tests: benchdnn: support sdpa / gqa training with gradients for mask #4404

Are you sure you want to change the base?

graph: backend: dnnl, tests: benchdnn: support sdpa / gqa training with gradients for mask #4404

Uh oh!

Conversation

ElaineBao commented Dec 2, 2025

Description

Uh oh!

TaoLv Dec 2, 2025

Choose a reason for hiding this comment

Uh oh!

ElaineBao Dec 2, 2025

Choose a reason for hiding this comment

Uh oh!

ElaineBao commented Dec 3, 2025

Uh oh!

TaoLv left a comment

Choose a reason for hiding this comment

Uh oh!

TaoLv Dec 5, 2025

Choose a reason for hiding this comment

Uh oh!

TaoLv Dec 5, 2025

Choose a reason for hiding this comment

Uh oh!

TaoLv Dec 5, 2025

Choose a reason for hiding this comment

Uh oh!

dzarukin Dec 5, 2025

Choose a reason for hiding this comment

Uh oh!

dzarukin Dec 5, 2025

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants