feat: add aws-rft-sdk package for Reinforcement Fine-Tuning by xiaoxshe · Pull Request #5596 · aws/sagemaker-python-sdk

xiaoxshe · 2026-03-03T21:51:07Z

Summary

Add standalone aws-rft-sdk package that integrates SageMaker RFT (Reinforcement Fine-Tuning) with Strands agent framework
RolloutFeedbackClient: calls real CompleteTrajectory and UpdateReward APIs via SigV4-signed requests
@rft_handler: decorator to extract rollout metadata from payloads and manage RFT context
RFTContext: thread-local context that produces X-Rft-Job-Arn, X-Trajectory-Id, X-Span-Id headers
wrap_model: Strands model adapter that injects these headers into every inference call via extra_headers

API Integration

Uses the AgenticRFTRuntimeService alpha endpoint (finetuning-job-runtime.alpha.sagemaker.us-west-2.api.aws):

POST /CompleteTrajectory — marks trajectory as complete (PENDING -> READY)
POST /UpdateReward — submits per-transition rewards (READY -> REWARD_RECEIVED)
POST /sample — OpenAI-compatible inference proxy with trajectory capture via X-Rft-Job-Arn, X-Trajectory-Id, X-Span-Id headers
SigV4 signing with service name sagemaker

Test Results

Against alpha endpoint:

CompleteTrajectory: 404 for non-existent trajectory (API reachable, auth working)
UpdateReward: 404 for non-existent trajectory (API reachable, auth working)
SampleInvoke: 400/500 with validation errors (API reachable, requires valid job ARN)

Unit/Integration tests (5/5 pass):

RFTContext produces correct X-Rft-Job-Arn, X-Trajectory-Id, X-Span-Id headers
wrap_model injects headers into inner model's stream() call
RolloutFeedbackClient sends SigV4-signed CompleteTrajectory request
RolloutFeedbackClient sends SigV4-signed UpdateReward request
End-to-end: @rft_handler -> RFTContext -> wrap_model -> correct headers injected

Strands SDK compatibility:

72/72 OpenAI model tests pass (no regressions from extra_headers change)

Add a standalone SDK package that integrates SageMaker RFT (Reinforcement Fine-Tuning) with Strands agent framework. Provides: - RolloutFeedbackClient: report rewards back to the training service - @rft_handler: decorator to extract rollout metadata from payloads - RFTContext: thread-local context for propagating training metadata - wrap_model: Strands model adapter that injects X-RFT-* headers

- client.py: implement CompleteTrajectory and UpdateReward using SigV4- signed HTTP calls to finetuning-job-runtime.alpha.sagemaker endpoint - context.py: align header names with service API (X-Rft-Job-Arn, X-Trajectory-Id, X-Span-Id); auto-generate span ID per inference call - pyproject.toml: add requests dependency Tested against alpha endpoint: - CompleteTrajectory: 404 for non-existent trajectory (API reachable) - UpdateReward: 404 for non-existent trajectory (API reachable) - SigV4 signing with service name 'sagemaker' confirmed working - End-to-end header injection via wrap_model verified

xiaoxshe force-pushed the feat/aws-rft-sdk branch from 7a8081c to 9615fc9 Compare March 3, 2026 22:01

xiaoxshe closed this Mar 5, 2026

xiaoxshe deleted the feat/aws-rft-sdk branch March 5, 2026 00:43

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat: add aws-rft-sdk package for Reinforcement Fine-Tuning#5596

feat: add aws-rft-sdk package for Reinforcement Fine-Tuning#5596
xiaoxshe wants to merge 2 commits intoaws:masterfrom
xiaoxshe:feat/aws-rft-sdk

xiaoxshe commented Mar 3, 2026 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

xiaoxshe commented Mar 3, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Summary

API Integration

Test Results

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

xiaoxshe commented Mar 3, 2026 •

edited

Loading